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白 鳝 ”本 名 徐 戟 ， 国 内 资深 Oracle 数 据 库 
优化 专家 ， 从 事 Oracle 数 据 库 应 用 开发 、 
性 能 优化 工作 超过 15 年 。 曾 供职 于 DEC、 
赛 格 集团 、 长 天 集团 、 联 想 集团 等 国内 外 
知名 企业 ， 担 任 过 应 用 体系 总 监 、 技 术 总 
监 等 高 级 技术 职务 。 曾 主持 开发 了 国内 第 
一 套 联 机 实时 计 费 系统 ， 国 内 第 一 套 三 检 
合 一 的 检验 检疫 综合 业务 系统 。1999 年 起 
致力 于 Oracle 数 据 库 性 能 优化 等 方面 的 研 
究 ， 参 与 了 大 量 性 能 优化 项 目 ， 积 累 了 许 
多 实际 工作 案例 。2008 年 起 ， 在 博客 上 连 
载 《DBA 日 记 》， 和 希望 将 自己 在 Oracle 数 
据 库 应 用 领域 的 10 多 年 的 经 验 与 广大 读者 
分 享 。 

关于 本 书 和 作者 的 更 多 信息 ， 可 以 访问 
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内 容 提 要 








本 书 是 一 本 介绍 Oracle 数据 库 优化 方法 的 书 ， 以 一 个 实际 的 大 型 优化 项 目 为 原型 ， 用 日 记 的 形式 记录 了 
一 个 优化 小 组 的 DBA 如 何 从 纷繁 的 头绪 中 找到 突破 口 ， 进 而 完成 了 一 个 看 似 不 可 能 完成 的 任务 的 历程 。 在 


日 记 之 间 ， 作 者 还 穿插 了 优化 小 技巧 、 每 





























日 点 评 等 ， 总 结 了 数据 库 优 化 常用 的 方法 、 工 具 和 技巧 。 男 外 本 书 











第 一 次 详尽 地 披露 了 Oracle 数据 库 内 部 存储 结构 ， 并 公布 了 部 分 代码 ， 对 于 有 兴趣 研究 数据 库 内 部 存储 结构 








或 者 编写 dul 工具 的 读者 有 











定 的 参考 价值 。 





本 书 适合 Oracle 数据 库 管理 开发 人 员 阅 读 。 
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给 初学 者 的 建议 


为 什么 写 DBA Bic 


我 的 QQ 网 名 叫 “ 老 网 虫 白 鳝 "， 很 多 网 友 都 问 我 为 什么 起 了 这 么 土 的 一 个 网 名 。 实 际 上 ， 

这 个 网 名 应 该 是 1998 年 的 时 候 起 的 。10 多 年 前 ， 我 是 个 十 分 喜欢 玩 些 新 鲜 东 西 的 人 ，ADSL 刚 
刚 在 中 国 出 现 ， 我 就 成 为 中 国 第 一 批 使 用 ADSL 的 宽带 用 户 ， 时 间 好 像 是 1998 年 。 通 过 宽带 上 
网 确实 很 快 ， 也 拓宽 了 我 在 网 上 的 视野 ， 对 于 用 惯 了 拨号 网 络 的 我 ,第 一 次 感受 到 了 飞 一 样 的 上 
网 感觉 。 有 一 天 中 午 ， 和 儿 个 朋友 一 起 吃饭 ,说 起 了 ADSL， 朋 友 很 是 苹 慕 ， 不 过 对 于 我 每 天 只 
是 上 网 看 看 新 闻 , 在 四 通 利 方 上 打 打 嘴 使 , 感到 很 是 不 届 。 他 建议 我 去 试 试 OICQ。 在 注册 OICQ 
账号 的 时 候 ， 我 想 继续 使 用 在 四 通 利 方 上 的 网 名 “水 鱼 "， 不 过 “水 鱼 ” 很 容易 让 人 产生 不 愉快 
的 联想 , 于 是 我 准备 换 一 个 网 名 , 由 于 双鱼 座 的 我 对 水 产品 的 热爱 , 我 想起 了 中 午 的 午餐 “ 白 鳝 ”。 
“ 白 鳝 ”也 就 是 我 们 常 说 的 河 鳗 ， 广 东 人 称 之 为 “ 白 鳝 "。 结 果 ，QQ 上 就 多 了 一 条 “ 白 鳝 "。 光 阴 
佳 彰 ,突然 有 一 天 我 发 现 我 的 网 龄 已 经 接近 10 年 了 。 于 是 把 网 名 又 改 成 了 “ 老 网 虫 白 鳝 "。 说 实 
FEIN, 没有“ 老 网 虫 *"， 就 没有 作为 DBA 的 “ 白 鳝 。 是 互联 网 让 我 从 一 名 仅仅 会 安装 Oracle 的 
入 门 者 成 长 为 一 名 资深 的 DBA, 

在 网 上 和 网 友 讨 论 Oracle 已 经 有 10 年 了 ， 很 多 网 友 问 我 为 什么 不 写本 书 ， 其 实 我 也 一 直 想 
写本 关于 Oracle 的 书 。2002 年 ， 我 产生 了 把 来 自 Metalink 的 学 习 成 果 写 出 来 的 想法 ， 书 名 都 起 
好 了 ， 叫 《Oracle 深度 历险 》。 书 编写 了 一 年 多 ，Word 文档 算 下 来 也 有 1000 多 页 。 在 2004 年 我 
校对 这 本 书 时 ， 发 现 其 中 的 大 多 数 内 容 都 包含 在 市 面 上 相关 图 书 中 ， 出 版 价值 并 不 大 。 虽 然 第 一 
次 写 书 很 失败 ， 不 过 写 一 本 书 的 想法 一 直 没 有 磨灭 。 但 因 工 作 第 忙 ， 很 少 有 大 块 空 闲 时 间 用 以 写 
作 ， 因 而 也 难于 写 出 一 本 连贯 性 很 强 的 书 来 。 当 年 看 王强 的 《圈子 圈套 》 时 一 下 子 被 迷 住 了 ， 推 
荐 给 很 多 朋友 ,看 过 的 人 都 说 在 里 面 能 够 看 到 自己 的 影子 , 我 当时 看 《圈子 圈套 》 的 感觉 也 是 如 
此 。 说 起 来 和 王强 还 有 过 一 面 之 缘 ， 根 本 就 没 把 他 和 作家 联系 起 来 ， 但 是 他 的 作品 在 IT 圈子 里 
的 人 看 来 ， 比 作家 写 得 更 深入 。 因 为 这 是 他 在 TT 圈子 里 摸 抱 深 打 的 经 验 总 结 。 看 过 《圈子 圈套 》 
Jn, 我 开始 写 (IT AND D), 王强 是 从 一 个 系统 集成 行业 的 高 层 人 物 的 角度 去 看 问题 , 而 《IT AND D) 
里 的 莫 明 是 这 个 圈子 里 处 于 底 端的 工程 师 。 现 在 《ITAND D) 在 我 的 另外 一 个 博客 (blog.oracle- 
fans.cn/baishan2) 里 连载 ， 不 过 最 近 也 已 经 很 长 时 间 没 有 更 新 了 。 我 是 一 个 比较 懒散 的 人 ， 也 不 
想 给 自己 太 大 的 压力 ， 只 是 想 把 我 这 些 年 里 做 DBA 的 一 些 经 验 写 出 来 ， 共 享 给 大 家 ， 所 以 我 决 




















































































































IV Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





定 写 这 本 书 。 开 始 写 的 时 候 ， 我 的 初衷 还 是 自 娱 自 乐 ， 并 没有 出 书 的 打算 。 

直到 有 一 天 , 我 和 我 的 一 个 同学 在 北京 相聚 。 他 以 前 在 BEA 公司 , 在 Oracle 收购 BEA 以 后 ， 
他 成 为 Oracle 一 个 售 前 部 门 的 总 监 。 我 说 了 一 些 DBA 圈子 里 的 事情 , 他 也 介绍 了 Java 圈子 里 的 
一 些 事情 。Oracle 圈子 和 Java 圈子 全 然 不 同 ，Java 圈子 是 一 个 十 分 开放 的 圈子 ， 由 于 Java 的 开 
源 性 ， 整 个 Java 圈子 都 十 分 开放 ， 大 家 都 以 把 自己 的 工作 成 果 开 放出 来 给 大 家 分 享 为 来 ， 所 以 
Java 技 术 发 展 十 分 迅速 , 技术 方面 的 创新 层出不穷 。 RE, Oracle 圈子 只 有 开放 了 , 才 可 能 像 Java 
圈子 那样 欣欣 向 荣 。 从 那 次 开始 ， 把 本 书 公开 发 表 的 想法 就 逐渐 形成 了 。 这 也 是 我 这 一 次 重新 修 
订 《Oracle 优化 日 记 》 的 一 个 主要 目的 。 既 然 目的 是 正式 出 版 ， 那 么 书 中 的 很 多 内 容 就 不 能 太 随 
ES, REM SER SHER, ARATE. 

现在 大 多 数 的 Oracle 图 书 都 是 以 技术 为 主 ， 而 且 品 种 十 分 丰富 ， 但 是 对 于 DBA 来 说 ， 要 学 
的 不 仅仅 是 技术 ， 还 有 很 多 东西 不 是 仅仅 通过 技术 传授 所 能 学 到 的 。 作 为 一 名 优秀 的 DBA， 需 
要 具备 一 些 气 质 、 一 些 性 格 以 及 一 些 处 事 的 方法 和 原则 。 这 些 都 不 是 纯 技 术 的 问题 ， 但 是 往往 和 
我 们 的 DBA 生涯 关系 重大 。 我 写 这 本 书 的 初 囊 也 是 为 了 把 我 和 其 他 朋友 DBA 生涯 中 的 一 些 故事 
介绍 给 正在 学 习 或 者 使 用 Oracle 的 DBA 们 看 。 本 书 不 是 一 部 小 说 ,因为 里 面 将 会 介绍 很 多 DBA 
的 知识 和 技术 。 但 是 本 书 也 不 是 一 本 纯粹 的 技术 书 ， 因 为 其 中 穿插 了 很 多 故事 情节 ， 除 了 那些 风 
花 雪 月 的 事情 ， 其 他 情感 几乎 都 会 在 日 记 里 体现 。DBA 从 事 的 是 一 种 职业 ， 在 职业 生涯 里 也 会 
有 喜 怒 哀乐 。 除 了 技术 以 外 ， 我 想 我 也 应 该 把 这 些 喜 级 哀 乐 传递 给 大 家 。 

为 了 叙事 方便 ， 我 会 把 发 生 在 很 多 人 身上 的 事情 集中 在 “我 ”一 个 人 的 身上 ,“ 我 ”不 仅仅 
RRETHI, 更 代表 了 一 批 奔 四 的 老 DBA。 为 了 避免 一 些 法 律 问 题 ， 部 分 客户 会 使 用 化 名 或 者 
故事 情节 会 有 所 演绎 。 本 书 总 的 来 说 还 是 一 本 技术 性 图 书 ， 并 不 针对 某 个 人 或 者 某 个 企业 ,因此 
请 DBA 或 业界 朋友 不 要 对 号 入 座 。 

另外 ,十 分 感谢 储 学 玉 、 能 文 华 、 罗 时 峰 、 邓 智 国 等 为 本 书 提 供 的 技术 资料 和 精彩 案例 、 毕 
建 波 、 醇 军 和 吴刚 提供 的 实验 数据 ， 也 十 分 感谢 彭 国 秋 、 段 小 真 、 段 小 成 对 本 文中 文法 的 校对 。 
当然 也 要 感谢 老 方 、 老 于 、 老 肖 、 老 能 和 小 齐 ， 我 至 今 还 很 怀念 儿 个 人 在 一 起 喝酒 谈论 Oracle 
的 日 子 , 没有 数 年 前 我 们 的 那 一 次 合作 ,就 没有 今天 的 这 本 书 。 另 外 ， 远 在 澳大利亚 的 Ben 和 美 
国 的 John 也 给 了 我 极 大 的 支持 。 在 我 写 《Oracle 深度 历险 》 的 时 候 Ben 也 给 予 了 我 极 大 的 鼓励 ， 
H HÆ 2002 年 很 诚 悬 地 告诉 我 这 本 书 已 经 落伍 了 。Ben 希望 我 写 一 些 更 深入 的 更 有 价值 的 东西 。 
我 终于 完成 了 对 Ben 的 承诺 。 


谁 适合 看 这 本 日 记 
本 书 最 早 是 在 我 的 博客 上 连载 的 。 连 载 期 间 ， 有 些 朋友 产生 了 共鸣 ， 有 些 朋 友 说 看 不 太 懂 ， 
有 些 朋友 说 深 受 启发 。 那 些 产生 共鸣 的 人 大 概 也 是 资深 DBA 了 。 本 书 是 比较 真实 的 ， 虽然 也 有 


一 些 艺 术 夸大 的 成 分 ， 但 也 都 是 有 现实 依据 的 。 
那些 看 不 懂 的 朋友 ， 还 是 没有 理解 我 的 意思 ， 实 际 上 本 书 就 像 流水 账 一 样 记录 了 一 些 DBA 日 













































































给 初学 者 的 建议 V 





常 的 工作 。 如 果 你 觉得 看 不 懂 ， 可 能 是 你 还 没有 碰 到 过 那 种 情况 ， 你 不 需要 理解 其 中 的 每 个 技术 
细节 ， 看 不 人 懂 的 地 方 完 全 可 以 跳 过 ， 这 并 不 妨碍 你 看 其 他 章节 。( 当 然 书 中 对 有 些 问 题 的 处 理 过 
程 写 得 过 于 简单 , 读者 不 容易 看 懂 , 因此 在 为 出 书 而 修订 时 , 我 已 经 将 这 些 案例 的 处 理 过 程 细 化 。 
另外 ， 对 于 刚刚 入 门 的 DBA 来 说 ， 本 书 从 一 个 优化 案例 入 手 ， 可 能 确实 会 感觉 有 点 不 容易 摸 到 
头脑 。 不 过 不 要 紧 ， 你 完全 可 以 把 这 本 书 当做 一 本 写 得 比较 通俗 的 小 说 来 看 ， 跳 过 那些 生 鹰 的 技 
术 描 述 ， 提 前 体会 一 下 DBA 优化 项 目 时 会 遇 到 些 什 么 问题 ， 以 及 如 何 面 对 和 处 理 这 些 问 题 。 只 
要 你 理解 了 DBA 分 析 问 题 的 思路 与 方法 ， 这 本 书 对 你 来 说 就 值 了 。 

那些 感觉 深 受 启发 的 人 ， 应 该 是 刚刚 进入 DBA 行业 的 新 手 。 这 本 书 中 的 很 多 技术 都 是 这 些 
DBA 目前 正在 接触 和 使 用 的 ， 而 他 们 又 往往 缺乏 接触 大 型 优化 项 目的 机 会 。 前 几 天 有 个 网 友 问 
我 ， 他 正 准备 接手 一 个 优化 项 目 ， 能 不 能 给 他 介绍 一 下 优化 项 目 该 怎么 做 。 我 推荐 他 到 我 的 博客 
上 去 看 看 本 书 。 也 许 和 你 以 前 看 到 的 Oracle 书 有 点 不 同 ， 不 过 书 就 是 书 ， 而 不 是 至 高 无 上 的 “ 葵 
花 宝 典 “。 如 果 你 认为 看 过 一 本 书 就 能 成 为 高 手 ， 那 你 就 错 了 。 





























一 名 老 DBA 的 成 长 之 路 


结缘 Oracle 


从 1993 年 第 一 次 帮 客 户 安装 Oracle HE, RFN Oracle 已 有 了 16 年 的 亲密 接触 。 说 实在 的 ， 
第 一 次 接触 Oracle, 我 对 它 的 印象 十 分 差 。 在 此 之 前 , 我 只 接触 过 一 个 大 型 数据 库 一 一 DEC 公司 
的 RDB (现在 它 已 归 入 Oracle 名 下 了 )。 当 时 ， 国 内 使 用 的 最 广泛 的 小 型 机 平台 是 DEC 公司 的 
VAX, 操作 系统 是 20 ERRAINA OpenVMS, 20 世纪 80 年 代 后 出 生 的 人 耳熟能详 的 是 Unix 
和 Linux。 倒 退 十 几 年 ，20 世纪 90 年 代 初 或 者 更 早 的 计算 机 操作 系统 课程 中 ， 很 多 算法 都 来 自 
OpenVMS, 那 时 , 在 国内 使 用 最 广泛 的 Oracle 版 本 是 5.1, 而 且 当 时 大 家 的 版 权 意识 都 比较 薄弱 ， 
不 愿意 花 几 十 万 元 购买 正版 的 数据 库 ， 所 以 当时 有 一 种 职业 很 吃香 ， 即 能 够 帮 客 户 破 解 和 安装 系 
统 的 工程 师 。 

MEHE ,我 是 一 名 在 OpenVMS 上 开发 应 用 的 软件 工程 师 ,由 于 工作 关系 ,接触 了 较 多 的 VAX 
系统 。 也 因 当 时 懂 VMS 和 Oracle 的 人 十 分 稀缺 ， 因 此 常 有 集成 商 找 我 利用 周末 帮助 安装 系统 。 
我 第 一 次 和 Oracle 的 接触 就 是 这 样 开始 的 。 软 件 已 经 破解 好 ， 当 时 有 一 位 老师 水 平 很 高 ， 居 然 写 
出 了 一 个 生成 Oracle 许可 证 文件 的 程序 ， 花 上 2 000 元 就 可 以 买 到 一 个 和 机 器 码 绑 定 的 许可 证 ， 
安装 介质 就 是 那 种 20 年 前 十 分 流行 的 正方 形 磁 带 。 复 制 安装 介质 ， 编 译 链 接 ， 然 后 创建 数据 库 ， 
以 前 的 Oracle 安装 十 分 烦琐 , 连 数 据 文件 都 要 手工 创建 后 添加 到 表 空 间 里 。 当 我 手忙脚乱 地 忙活 
了 一 天 ,终于 赫 客 户 成 功 安 装 了 一 套 Oracle 5.1， 并 拿 到 2 000 元 钱 的 时 候 ， 心 里 别提 多 高 兴 了 ， 
因为 那 时 候 我 的 月 工资 不 过 1 000 元 。 虽 然 钱 挣 得 不 算 困 难 ， 但 是 Oracle 给 我 留 下 的 恶劣 印象 使 
我 很 长 时 间 不 愿意 接触 它 。 和 RDB 比 起 来 ，Oracle 简直 太 烦 琐 了 ， 其 性 能 和 功能 也 无 法 和 RDB 
相 比 。 基 于 这 个 认识 , 我 在 1994 年 帮助 泉州 电信 开发 计 费 系统 时 , 还 是 全 力 推 荐 客户 使 用 RDB。 
这 个 计 费 系统 十 分 成 功 ， 获 得 了 省 级 的 科技 进步 三 等 奖 。 

在 这 段 时 间 里 ， 我 在 每 个 项 目 中 都 会 碰 到 大 型 数据 库 ， 要 么 选择 Oracle， 要 么 选择 RDB, 
但 我 更 愿意 选择 RDB。 这 期 间 ，Oracle 在 不 断 进步 ， 而 RDB 随 着 OpenVMS 在 商业 上 的 失败 却 
日 薄 西 山 ， 几 年 后 终于 被 Oracle 收购 。1995 年 ， 我 为 一 个 政府 部 门 设计 一 套 电子 单据 处 理 系 统 
时 ， 客 户 坚 持 使 用 开放 的 Unix 系统 ， 而 拒绝 使 用 OpenVMS。 在 Unix 平台 上 ，Oracle 成 了 我 唯 
一 的 选择 ， 当 时 正 是 Oracle 7.1 大 行 其 道 的 时 候 。Oracle 7 有 了 太 大 的 进步 ， 其 方便 的 安装 配置 
以 及 优异 的 性 能 让 我 感到 十 分 意外 。 因 此 ， 在 1996 年 我 为 泉州 电信 设计 联机 实时 计 费 系统 时 ， 
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Oracle 成 了 我 的 首选 ， 正 是 这 个 项 目 让 我 真正 喜欢 上 了 Oracle。 当 时 使 用 的 服务 器 是 一 台 有 两 个 
21164 CPU, 256MB 内 存 的 DEC Alpha2100， 虽 然 今天 看 来 ， 这 台 服 务 器 还 不 如 现在 的 一 台 普 通 
PC, 但 在 当时 则 代表 了 最 先进 的 64 位 计算 的 服务 器 ， 完 成 了 一 个 具有 上 百 万 市 话 用 户 、50 万 长 
话 有 权 用 户 的 大 型 本 地 网 的 联机 实时 计 费 系统 。 在 这 个 项 目 中 ， 我 第 一 次 对 Oracle 进行 了 优化 ， 
通过 调 优 的 系统 发 挥 了 强大 的 性 能 , 一 个 电话 在 挂机 后 5 — 10 秒 就 能 完成 通话 话 单 的 结算 。 后 来 
在 这 个 系统 的 基础 上 , 福建 富士 通 开 发 了 一 个 话费 回 送 系 统 , 挂机 后 儿 秒 钟 就 可 以 把 通话 费 回 送 
到 客户 的 来 电 显示 电话 上 。 

从 那 以 后 ， 我 和 Oracle 结 下 了 不 解 之 缘 。1997 年 ， 我 第 一 次 参加 了 Oracle Open World, J 
次 北京 的 盛会 除了 让 我 了 解 了 超大 内 存 (VLM) 和 超大 数据 库 (VLDB ) , 也 让 我 结识 了 一 批 Oracle 
第 三 方 服务 的 先行 北京 巨 龙 的 朋友 ， 他 们 在 Oracle 这 个 产业 上 获得 的 成 功 让 我 羡 莫 不已。 

真正 让 我 成 为 DBA 是 在 1999 年 后 。 此前, 我 虽然 和 Oracle 形影不离 ,不 过 我 的 主要 身份 还 
是 一 名 系统 架构 师 、 一 名 十 分 优秀 的 程序 员 ， 数 据 库 安装 、 维 护 和 优化 只 是 我 的 副业 。 从 1999 
年 开始 , 由 于 要 为 一 些 客户 提供 专业 的 第 三 方 技术 支持 , 我 开始 认真 研究 Oracle 的 架构 及 内 部 原 
理 。 我 花 了 差不多 两 年 的 时 间 ， 在 Metalink 上 阅读 了 至 少 2 000 份 技术 文档 ， 一 个 专题 一 个 专题 
地 研究 Oracle 的 内 部 原理 ， 从 寥寥 可 数 的 文字 中 解密 一 些 Oracle 秘 不 可 宣 的 “隐私 ”， 其 至 在 一 
HE bug JR AUNT SC FH SFR Oracle 内 部 原理 的 合理 解释 。 后 来 由 于 工作 关系 ， 我 接触 了 不 少 
Oracle 内 部 文档 。 我 发 现 若 能 早点 获得 这 些 文档 ， 那 么 整个 学 习 过 程 至 少 可 以 缩短 一 半 。 我 觉得 
Oracle 公司 应 该 开放 这 些 文档 ， 让 愿意 深入 研究 Oracle 的 人 员 学 习 。 

这 段 时 间 ， 我 经 常 上 技术 性 网 站 ITPUB。 刚 开始 的 时 候 ， 大 家 的 Oracle 水 平 都 很 有 限 ， 论 
坛 的 学 习气 氛 也 十 分 不 错 。 而 随 着 网 站 的 人 气 越 来 越 旺 , 在 论坛 里 大 家 不 再 是 一 起 学 习 和 讨论 问 
题 了 ， 而 是 不 停 地 扯皮 、 和 争吵 ， 于 是 ITPUB_ 上 有 一 批 人 转 到 了 www.oracle.com.cn， 我 也 在 这 个 
网 站 上 面 混 迹 了 一 段 时 间 。DBA 这 个 圈子 保守 的 气氛 使 这 些 网 站 都 很 难 成 为 真正 高 手 的 园地 。 
在 这 些 IT 网 站 上 ， 有 价值 的 内 容 越 来 越 少 ， 所 以 我 把 所 有 的 精力 都 放 到 了 Metalink 上 。 


经 常 有 DBA 和 我 探讨 学 习 过 程 中 的 各 种 迷茫 和 痛 若 。 学 习 Oracle， 在 最 初 的 阶段 是 十 分 轻 
公 的 。Oracle 的 技术 资料 唾 手 可 得 ， 对 于 初学 者 来 说 ， 这 一 点 十 分 重要 。 不 过 随 着 学 习 的 深入 ， 
很 多 DBA 都 感觉 好 像 遇 到 了 瓶颈 ， 无 论 自 己 多 么 努力 ， 技 术 水 平 想 要 提高 就 十 分 困难 了 。 实 际 
上 ，DBA 在 其 成 长 过 程 中 ， 所 需要 学 习 的 不 仅仅 是 技术 。 现 在 介绍 Oracle 技术 的 图 书 已 经 相当 
多 了 ， 通 过 阅读 这 些 图 书 ，DBA 应 该 能 够 学 到 足够 的 专业 知识 了 。 不 过 大 家 可 能 都 有 这 样 的 感 
觉 ， 刚 开始 学 Oracle 时 ， 觉 得 OCP 是 一 道 十 分 高 的 门槛 ， 总 觉得 不 知道 自己 需要 花 上 多 少时 间 才 
能 达到 那个 境界 。 而 事实 上 ， 真 正 想 要 去 考 OCP 认证 ， 花 上 半年 到 一 年 的 时 间 也 就 足够 了 。 而 通 
过 OCP 认证 考试 后 ， 自 己 还 是 感觉 到 心里 空空 的 ， 碰 到 问题 还 是 找 不 到 解决 的 方法 。 

实际 上 ， 如 果真 正 认 真 学 习 了 OCP 课程 ， 了 解 了 Oracle 的 一 些 基 本 原理 ， 并 且 通 过 OCP 考 
试 后 ， 理 论 上 已 经 具有 相当 的 基础 了 。 只 是 Oracle DBA 工作 不 是 考试 ，OCP 理论 也 只 是 一 个 初 


















































VIII Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





级 的 理论 ， 如 何 将 这 些 理论 知识 融会 贯通 ， 实 际 应 用 到 日 常 工作 中 去 ， 是 十 分 关键 的 ， 这 也 就 是 
我 们 常 说 的 工作 方法 。 作 为 一 名 DBA， 除 了 学 习 理 论 知识 外 ， 工 作 方 法 也 是 十 分 关键 的 。 因 为 
DBA 是 一 个 职业 ， 而 不 是 一 门 课程 ， 理 论 知识 只 是 基础 ， 只 有 理论 基础 是 远 远 不 够 的 。 我 磁 到 
过 很 多 正在 学 习 Oracle 的 朋友 ， 他 们 很 容易 走 入 两 个 极端 : 一 种 是 仅仅 注重 理论 ， 看 了 很 多 书 ， 
但 总 是 感觉 看 书 时 好 像 什么 都 懂 了 , 一 放下 书 就 觉得 好 像 什 么 都 没 学 到 , 真正 碰 到 问题 时 还 是 两 
眼 一 抹黑 ， 另外 一 种 是 觉得 读书 太 枯 燥 ， 总 是 喜欢 自己 摸索 ， 他 们 哪怕 碰 到 一 点 点 小 问题 ， 都 会 
去 寻求 其 他 人 的 帮助 ， 而 不 愿意 自己 去 书本 里 学 习 。 实 际 上 ， 在 一 个 DBA 成 长 的 过 程 中 ， 需 要 
将 读书 和 实践 有 机 结合 起 来 ， 读 书 固然 重要 ， 不 过 没有 实践 操作 ， 就 无 法 巩固 书 中 学 到 的 知识 。 

不 过 并 不 是 每 个 人 都 有 条 件 能 够 参加 各 种 实践 活动 的 ， 特 别 是 刚刚 入 门 的 DBA， 他 们 往往 
缺少 大 型 项 目 和 大 型 数据 库 维 护 的 经 验 ， 这 对 于 他 们 在 技术 上 的 提高 是 很 不 利 的 。 这 时 其 他 人 
的 经 验 就 是 很 好 的 教材 。 本 书 的 目的 是 把 我 这 些 年 在 DBA 工作 中 磁 到 的 一 些 典 型 案例 用 一 种 很 
轻松 的 方式 说 出 来 ， 让 大 家 在 看 这 些 案例 时 学 习 到 分 析 问 题 的 方法 。 如 果 看 本 书 时 ， 仅 仅 去 关 
注 那 些 技术 性 的 东西 ， 那 就 本 末 倒 置 了 。 本 书 的 真正 精华 是 那些 像 流水 账 似 的 东西 ， 所 以 大 家 
不 要 把 它 当 做 一 本 技术 宝典 来 使 用 ， 其 中 涉及 的 技术 都 是 大 家 在 其 他 地 方 能 够 学 习 到 的 。 大 家 
更 应 该 看 到 的 是 我 在 碰 到 各 种 问题 时 ， 是 如 何 处 理 的 ， 是 如 何 把 一 些 很 基本 的 技术 运用 到 这 些 
项 目 中 去 的 。 记 得 有 一 次 我 去 一 个 客户 那里 做 性 能 分 析 ， 分 析 结 束 后 ， 给 客户 介绍 的 时 候 ， 客 
户 说 你 说 的 这 些 技术 我 都 学 过 ， 怎 么 你 能 说 的 如 此 头头 是 道 ， 而 我 却 无 法 把 这 些 知识 和 实际 工 
作 结 合 起 来 呢 ? 那 位 客户 不 和 久 前 刚刚 通过 了 OCM 考试 ,按理 说 他 的 技术 水 平和 实际 操作 能 力 应 
该 是 足够 的 ， 为 什么 他 无 法 把 知识 和 实际 结合 起 来 呢 ? 实际 上 这 就 是 工作 方法 问题 ， 也 就 是 本 
书 想 要 教 给 大 家 的 。 

每 个 DBA 的 成 长 之 路 是 完全 不 同 的 , 我 开始 接触 Oracle IF, 在 国内 接触 Oracle 的 人 还 很 少 。 
当时 唯一 能 够 找到 的 Oracle 资料 除了 Oracle 随机 文档 外 ， 就 只 有 太极 出 的 那 套 VAX 技术 书 里 届 
指 可 数 的 几 本 薄 薄 小 册子 了 。 刚 开始 接触 Oracle 时 仅仅 是 安装 Oracle， 最 早 是 OpenVMS 平台 ， 
后 来 逐渐 转移 到 Unix 平台 : SCO Unix. DIGITAL Unix, IRIX, SUNOS 等 。Oracle 5 和 Oracle 6 
在 性 能 优化 上 没有 什么 可 做 的 ， 主 要 是 针对 SQL 进行 优化 ， 维 护 管理 也 较为 简单 ， 主 要 是 表 空 
间 管 理 。 那 时 的 系统 也 比较 小 ， 一 般 都 在 几 百 兆 字 节 到 几 个 吉 字 节 之 间 ， 所 以 也 很 少 能 够 磁 到 
Oracle 的 bug。 不 过 在 这 段 时 间 里 ， 有 较 多 的 机 会 接触 小 型 机 、 网 络 、 操 作 系统 和 应 用 开发 ， 这 
些 经 历 都 让 我 在 今后 的 DBA 生涯 受益 匪 浅 。 随 着 DBA 工作 做 得 越 来 越 专 一 , 接触 数据 库 以 外 的 
工作 就 越 来 越 少 ， 到 目前 为 止 ， 可 能 除了 数据 库 以 外 ， 其 他 技术 都 基本 上 停留 在 理论 上 了 。 

对 于 一 名 初级 DBA， 多 接触 一 下 其 他 技术 是 十 分 有 好 处 的 。 随 着 时 间 的 推移 、 年 龄 的 增长 ， 
学 习 能 力 和 学 习 新 东西 的 速度 都 会 有 不 小 的 下 降 。 我 曾经 在 赛 格 计算 机 公司 工作 过 几 年 ,该 公司 
是 国内 最 早 的 系统 集成 商 之 一 ， 其 创始 人 查 树 衡 多 次 出 现在 徐 迟 老 先生 的 报告 文学 里 ， 在 20 世 
纪 80 年 代 末 是 类 似 于 当今 杨元庆 、 郭 为 这 样 的 风云 人 物 。 在 赛 格 计算 机 工作 的 几 年 ， 有 大 量 机 
会 接触 系统 基础 ， 接 触 VAX 小 型 机 、DEC 网 络 产品 和 存储 产品 ， 甚 至 我 还 帮助 公司 “ 攒 ”了 几 
台 小 型 机 。 在 很 长 的 一 段 时 间 里 ， 这 段 经 历 对 我 都 有 很 大 的 帮助 。 
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特别 值得 一 提 的 是 ， 应 用 软件 开发 方面 的 经 验 对 我 的 DBA 工作 帮助 良 多 。DBA 是 在 与 系统 

和 应 用 打交道 , 而 不 是 仅仅 与 数据 库 打 交道 ， 因 此 应 用 软件 开发 、 应 用 软件 体系 架构 方面 的 经 验 
和 知识 是 必 不 可 少 的 。 在 完全 成 为 一 名 DBA 之 前 ， 我 曾经 是 一 名 软件 工程 师 、 项 目 经 理 、 系 统 
架构 师 。 我 设计 过 大 量 的 应 用 软件 ， 因 此 在 分 析 一 个 系统 时 , 我 往往 能 够 从 开发 者 的 角度 去 考虑 
问题 ， 在 处 理 问题 时 比较 能 够 抓 住 关键 ， 提 出 的 建议 也 能 够 切合 实际 。 我 经 常 看 到 一 些 DBA 给 
客户 提出 的 优化 建议 ,从 Oracle 数据 库 的 理论 上 来 看 这 些 建议 没有 问题 ,不 过 作为 一 个 系统 来 说 ， 
这 些 建 议 的 针对 性 不 强 , 可 操作 性 很 低 , 这 种 建议 哪怕 提 得 再 多 , 再 深刻 , 包含 的 技术 含量 再 高 ， 
也 是 没有 多 大 价值 的 。 
在 刚刚 进入 DBA 这 个 行业 , 特别 是 刚刚 工作 时 ,应 该 多 接触 一 些 应 用 开发 、 系 统 体 系 架构 、 
I 架构 和 硬件 方面 的 知识 。 这些 知 识 的 学 习 不 能 停留 在 表面 上 , 而 应 该 较为 深入 地 去 了 解 。 做 过 
系统 工程 师 或 软件 工程 师 的 DBA 往往 更 容易 成 功 。 最 理想 的 状态 是 在 做 DBA 之 前 做 过 一 两 年 开 
发 ， 还 从 事 过 个 把 年 的 硬件 工程 师 工作 。 实 际 上 ， 在 DBA 的 工作 中 ， 不 断 地 要 面 对 应 用 软件 和 
系统 硬件 方面 的 问题 。 在 实际 工作 中 ,也 会 不 断 地 学 习 这 些 方面 的 知识 。 如 果 你 并 没有 像 我 说 的 
那样 ， 在 从 事 DBA 这 个 职业 之 前 从 事 过 软件 开发 或 者 硬件 维护 的 工作 ， 那 也 没有 什么 关系 。 在 
DBA 工作 中 ， 尽 可 能 多 地 去 学 习 这 方面 的 知识 就 行 了 。 

在 1992 年 到 1998 年 ， 我 逐渐 从 安装 Oracle 转向 在 Oracle 上 做 各 种 应 用 软件 ， 其 中 也 经 常 
对 数据 库 进 行 简单 的 性 能 分 析 和 优化 。 在 那 段 时 间 里 ，Oracle 相关 的 图 书 也 逐渐 多 了 起 来 。 通 过 
阅读 相关 图 书 ， 我 对 Oracle 的 一 些 基 础 知识 有 了 一 个 整体 的 认识 。 

在 工作 几 年 后 ， 我 虽然 安装 过 上 百 套 Oracle 数据 库 了 ， 不 过 对 Oracle 的 认识 还 是 停留 在 很 
低 的 层次 ， 于 是 我 想 系统 地 学 习 一 下 Oracle 数据 库 。 在 这 段 时 间 里 ， 有 一 本 书 对 我 帮助 很 大 , 3B 
就 是 机 械 工业 出 版 社 出 版 的 《Oracle 初学 者 指南 》， 这 本 书 不 厚 ， 不 过 对 于 初学 者 来 说 ， 已 经 很 
全 面 了 。 后 来 我 也 向 很 多 初学 者 推荐 过 这 本 书 ， 但 现在 在 书店 里 很 难 找到 了 。 另 外 ， 赵 松涛 编写 
的 《Oracle 9i 中 文 版 基础 培训 教程 》 对 于 初学 者 入 门 来 说 也 是 十 分 好 的 。 实 际 上 ，Oracle 的 官方 
文档 里 有 一 些 入 门 性 的 文档 ， 对 于 初学 者 来 说 也 是 很 有 用 的 。2 Day DBA 就 是 一 本 十 分 不 错 的 入 
门 图 书 ， 很 适合 初学 者 阅读 。 

在 工作 中 , 我 也 经 常 碰 到 关于 性 能 方面 的 问题 。 早 期 的 时 候 ， 对 于 性 能 的 分 析 仅 仅 在 各 种 缓 
冲 区 的 命中 率 方面 ， 我 用 Delphi 编写 了 一 个 小 程序 ， 把 一 些 常 用 的 脚本 编写 成 一 个 性 能 分 析 小 
工具 ， 虽 然 那 个 小 工具 在 现在 的 绝 大 多 数 DBA 眼 里 只 能 算是 一 个 “小 玩意 儿 ”， 不 过 在 20 世纪 
90 年 代 末 ， 到 客户 那里 拿 出 一 个 自己 写 的 分 析 工 具 ， 客 户 还 是 能 够 高 看 你 一 眼 的 。 随 着 为 更 多 
的 客户 优化 系统 ， 在 性 能 分 析 方 面 ， 我 学 会 了 使 用 BSTAT/ESTAT 工具 ， 这 个 工具 就 是 现在 著名 
的 STATSPACK 工具 的 前 身 。 在 Oracle 7 上 ， 可 以 使 用 这 个 工具 来 进行 OWI 的 分 析 。 不 过 那 段 
时 间 里 ， 对 于 Oracle 的 学 习 还 不 是 很 系统 ， 主 要 是 在 工作 中 遇 到 什么 问题 ， 就 去 学 习 什 么 知识 。 
1999 年 ， 一 个 偶然 的 机 会 我 读 了 一 下 Oracle Concepts， 感 觉 这 本 书 对 我 的 帮助 很 大 ， 很 多 以 前 
工作 中 磁 到 的 疑点 都 在 这 本 书 里 找到 了 答案 。 所 以 我 会 给 每 位 Oracle 入 门 者 推荐 这 本 书 。 认真 读 
几 遍 这 本 书 ， 比 学 习 一 些 独门 秘籍 要 有 用 得 多 。Oracle Concepts 这 本 书 适合 不 同 层次 的 DBA H] 
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读 ， 对 于 初学 者 ， 了 阅读 这 本 书 可 以 打 好 基础 ， 不 过 第 一 次 阅读 这 本 书 的 人 ， 可 能 很 多 地 方 无 法 理 
解 ， 其 实 这 时 可 以 跳 过 那些 看 不 懂 的 章节 。 有 了 一 两 年 工作 经 验 后 ,再 来 阅读 这 本 书 时 ， 你 会 感 
觉 这 本 书 能 给 你 带 来 很 多 惊喜 , 很 多 工作 中 碰 到 的 菲 夷 所 思 的 事情 , 这 里 都 会 给 你 一 些 合理 的 解 
释 。 这 时 阅读 这 本 书 ,还 可 以 让 你 对 你 前 一 段 时 间 的 工作 和 学 习 做 一 个 梳理 ,得 到 一 个 很 大 的 提 
升 。 实 际 上 工作 几 年 后 再 来 阅读 这 本 书 的 一 些 章节 ， 还 是 感觉 会 有 收获 。 几 年 前 ， 我 粗 粗 地 浏览 
Oracle 10g Concepts 时 ， 仍 然 感 觉 受 益 菲 浅 。 

在 1999 年 ， 由 于 我 要 给 几 个 客户 做 一 些 维护 工作 ， 所 以 对 Oracle 的 知识 做 了 一 些 梳 理 ， 期 
间 阅 读 了 一 些 Oracle 图 书 , 但 最 大 的 发 现 是 Metalink。 由 于 给 客户 做 相关 服务 ， 从 客户 那里 拿 到 
了 Metalink 账号 ， 从 那 时 开始 ， 我 发 现 以 前 想 从 图 书 上 获取 的 知识 绝 大 多 数 都 能 够 在 Metalink 
上 获取 。 通 过 对 Oracle 概念 的 阅读 ,我 已 经 基本 上 掌握 了 Oracle 的 基本 概念 和 体系 , 知道 了 SGA、 
PGA 和 UGA 等 基本 概念 ， 但 是 这 些 概念 在 我 的 脑子 里 还 是 凌乱 的 、 不 成 体系 的 、 粗 浅 的。 这 些 
概念 对 于 我 做 一 些 复杂 的 分 析 帮 助 不 大 , 我 需要 更 加 深入 地 理解 这 些 概 念 。 在 1999 年 到 2000 E, 
由 于 客户 的 水 平和 维护 需求 也 相对 较 低 ， 所 以 虽然 我 在 协助 客户 进行 数据 库 维 护 , 实际 上 大 多 数 
工作 都 是 较为 初级 的 工作 。 这 段 时 间 里 我 花 了 大 量 的 精力 在 Metalink 上 阅读 技术 文档 , 这 时 的 主 
要 学 习 任 务 是 扩大 知识 面 。Oracle 是 十 分 庞大 的 体系 ， 其 广度 很 大 ， 如 果 要 掌握 Oracle 的 一 些 基 
本 技术 , 就 必须 花费 足够 的 时 间 。 在 这 之 前 , 我 的 Oracle 知识 主要 集中 在 和 应 用 软件 相关 的 方面 。 
通过 这 段 时 间 知 识 面 的 扩展 ， 我 对 一 些 Oracle 的 主流 技术 、 工 具 基 本 上 都 有 了 一 个 初步 的 认识 。 
这 段 时 间 的 学 习 对 于 从 事 系 统 架构 设计 的 我 来 说 , 帮助 也 是 十 分 大 的 ,因为 这 段 时间 里 我 面 对 的 
主要 系统 还 是 使 用 Oracle。 由 于 对 Oracle 数据 库 了 解 得 深入 ,在 我 进行 系统 设计 时 ， 就 不 自觉 地 
从 Oracle 数据 库 的 角度 去 考虑 应 用 软件 ， 使 应 用 软件 能 够 更 加 适合 Oracle， 更 多 地 利用 Oracle 
的 新 技术 。 


突破 瓶颈 


从 2000 年 开始 ， 我 突然 发 现 我 遇 到 了 瓶颈 ， 无 论 如 何 看 书 学 习 ， 自 己 的 技术 水 平 就 像 停 汪 
一 样 。 随 便 拿 一 本 书 翻 翻 ， 我 都 会 觉得 书 上 的 知识 我 都 看 过 ， 好 像 没 有 什么 东西 能 够 让 我 提升 能 
力 了 。 这 一 点 让 我 十 分 困惑 ， 因 为 我 知道 ， 对 于 Oracle 来 说 ， 我 刚刚 入 门 。 有 一 天 ， 我 和 海外 的 
一 位 朋友 在 MSN EMR, 说 起 了 这 个 问题 , 他 建议 我 写本 书 , 把 我 所 学 到 的 Oracle 知识 写 出 来 ， 
这 可 能 对 初学 者 有 很 大 帮助 。 事 后 我 考虑 了 儿 天 , 于 是 决定 写 一 本 关于 Oracle 数据 库 的 书 , BH 
"| (Oracle 深度 历险 》， 这 本 书包 括 第 1 章 Oracle 基础 知识 ， 第 2 HE SQL 与 Oracle 数据 库 编程 ， 
第 3 章 深 和 了解 Oracle 数据 库 , 第 4 章 OEM 与 其 他 Oracle 第 三 方 工具 , 第 5 章 备 份 恢复 与 容 灾 ， 
第 6 章 Oracle 数据 库 性 能 优化 。 为 了 编写 这 本 书 ， 从 2000 年 到 2003 年 ， 我 阅读 了 大 量 Oracle 
数据 库 方面 的 技术 资料 和 图 书 。 由 于 第 3 章 的 内 容 是 介绍 Oracle 基本 原理 的 , 所 以 我 查找 了 数 百 
篇 关于 Oracle 内 部 原理 的 技术 资料 ， 其 中 大 多 数 来 自 Metalink。 在 收集 资料 的 过 程 中 ,我 也 得 到 
了 美国 和 澳大利亚 Oracle 公司 朋友 的 大 力 协助 ， 获 得 了 大 量 仅 限 Oracle 公司 内 部 使 用 的 文档 。 
这 些 文档 对 于 我 理解 Oracle 的 内 部 原理 帮助 十 分 大 ， 并 且 我 已 经 陆续 将 甚 发 布 在 Oracle 粉丝 网 
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(http://www.Oraclefans.cn) ET. (Oracle 深度 历险 》 的 编写 工作 历时 3 年 ， 不 过 在 2004 年 我 第 
二 次 修改 这 本 书 时 ,还 是 决定 放弃 这 本 书 ， 因 为 那 时 候 Oracle 的 技术 书 已 经 相当 丰富 了 , 再 出 版 
同样 一 本 书 没有 任何 意义 。 虽 然 《Oracle 深度 历险 》 天 折 了 ， 不 过 写 书 的 目标 让 我 在 两 三 年 时 间 
里 对 Oracle 重新 梳理 了 一 遍 ， 对 Oracle 的 认识 也 更 加 深入 了 。 在 写 书 的 过 程 中 ， 对 于 每 个 知识 
点 ， 如 果 能 够 进行 实际 操作 的 ,我 必须 亲自 操作 一 遍 。 这 段 时 间 虽 然 没 有 写 出 一 本 好 书 ， 不 过 写 
书 的 经 历 对 我 来 说 是 一 笔 十 分 宝贵 的 财富 。 这 几 年 里 ， 我 突然 发 现 2000 年 时 我 感到 的 瓶颈 在 不 
知 不 觉 中 被 我 突破 了 。 在 这 之 前 ,我 学 习 了 大 量 零散 的 知识 ， 虽然 利 用 这 些 知识 可 以 解决 日 常 碰 
到 的 大 多 数 问题 ,但 是 我 并 疫 有 考虑 把 这 些 知识 串 起 来 ,并 没有 深入 地 去 了 解 Oracle 的 内 部 机 理 
因此 我 思考 问题 时 往往 只 局 限于 某 一 个 知识 点 。 通 过 这 3 年 的 写 书 经 历 , 我 习惯 于 从 Oracle 的 内 
部 机 理 来 思考 问题 ， 而 不 仅仅 是 从 某 个 问题 的 表象 人手。 这样 我 在 理解 一 些 Oracle 原理 时 ， 可 以 
更 加 深入 、 更 加 周到 。 写 书 带 给 我 的 思考 使 我 突破 了 瓶 开 ， 进 入 了 一 个 新 的 境界 。 

我 也 经 常 建议 公司 的 员工 , 不 要 光 看 书 ,看书 时 一 定 要 自己 亲自 做 一 遍 ， 然 后 再 把 做 的 过 程 
写成 文档 , 书 上 的 东西 才能 真正 变 成 自己 的 。 其 实 这 个 过 程 包含 了 几 个 步骤 , 第 一 步 是 通过 读书 
学 到 了 新 的 知识 ,然后 通过 自己 的 亲自 实践 将 书 中 学 到 的 新 知识 得 到 一 个 感性 的 体验 , 最 后 将 这 
个 体验 用 自己 的 语言 描述 出 来 ， 那么 这 个 知识 点 就 记 住 了 。 如 果 不 这 么 做 一 下 ,读书 的 效果 就 要 
打 很 大 的 折扣 了 。 

对 于 DBA 来 说 ， 写 博客 是 一 个 不 错 的 主意 。 将 自己 学 习 的 成 果 通 过 博客 整理 出 来 ， 既 可 以 
起 到 整理 思路 ， 完 善 知 识 点 掌握 的 作用 ， 又 可 以 通过 博客 和 其 他 DBA 进行 交流 ， 为 其 他 正在 学 
习 中 的 人 提供 技术 资料 ， 最终 达到 群体 学 习 的 目的 。 我 经 常 建议 公司 的 年 轻 人 群体 学 习 。 群 体 学 
习 说 起 来 很 简单 ， 就 是 如 果 存 在 一 些 知识 点 ， 有 几 个 人 都 想 去 学 习 ， 如 果 每 个 人 都 是 独立 地 去 学 
习 可 能 需要 花费 一 两 个 月 的 时 间 ， 如 果 换 一 种 学 习 方 法 ， 就 是 儿 个 人 分 分 工 ， 每 个 人 学 习 一 个 知 
识 点 , 然后 通过 互相 交流 的 方式 , 大 家 互相 传递 知识 。 这 种 学 习 方 法 可 能 可 以 缩短 一 倍 的 学 习 时 
iR], 而 且 学 习 到 的 知识 的 深度 也 会 高 于 一 个 人 自己 学 习 。 群 体 学 习 的 前 提 条 件 是 , 一 起 学 习 的 人 
的 水 平 基 本 接近 ， 而 且 大 家 都 很 开放 ， 都 愿意 把 自己 的 知识 拿 出 来 和 大 家 分 享 。 

大 成 之 道 

2000 年 的 写作 使 我 突破 了 第 一 个 瓶颈 ,不 过 很 快 我 又 遇 到 了 另外 一 个 瓶颈 , 这 也 是 很 多 DBA 
都 会 遇 到 的 。 在 2003 年 到 2004 年 ,我 经 常 有 碰 到 了 天 花 板 的 感觉 。 这 段 时 间 里 我 在 经 营 一 家 软 
件 公司 , 最 初 的 时 候 还 自己 写 一 些 代 码 , 随 着 公司 越 来 越 大 , 最 后 连 系 统 架 构 都 交 给 了 技术 总 监 。 
从 那 时 候 开 始 ， 我 觉得 自己 离开 发 越 来 越 远 了 ， 不 过 在 这 个 阶段 我 也 有 更 多 的 时 间 研 究 Oracle 
相关 的 技术 。 这 段 时 间 给 客户 做 优化 的 项 目 比 较 多 , 在 做 项 目 时 ， 总 是 感觉 很 难 较 快 地 抓 住 问 题 
的 核心 。 在 这 段 时 间 里 ， 我 阅读 了 大 量 Oracle 内 部 和 优化 的 相关 图 书 ， 包 括 Cost Based Oracle 
Fundamentals, Oracle 8i Internal Services for Waits Latches Locks and Memory, Inner Look on Oracle 
Latches, Oracle Performance Tuning & Tips, Oracle 9i Tuning Guide (Oracle t 7j X4), DSI 401E, 
DSI 402E 等 。 实 际 上 ， 每 一 本 书 对 我 理解 Oracle 都 有 很 大 帮助 ， 但 是 哪 一 本 书 也 没 办 法 解决 我 
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所 有 的 问题 ,在 很 多 地 方 涉及 内 部 原理 和 算法 时 也 往往 都 是 点 到 为 止 。DSI 是 Oracle 内 部 培训 教 
材 ， 也 是 广大 DBA 追逐 的 目标 。 认 真 学 习 一 下 DSI 对 理解 Oracle 内 部 原理 是 有 很 大 帮助 的 。 不 
过 想 理解 Oracle 内 部 原理 并 不 是 只 有 DSI 一 条 路 ， 说 实在 的 ，DSI 的 文档 ， 我 手头 有 一 些 ， 不 过 
真正 认真 去 看 过 的 也 只 有 DSI 401E $0 DSI 402E 这 两 个 ,现在 DSI 文 档 在 互联 网 上 很 容易 下 载 到 。 
系统 地 学 习 一 下 DSI 课程 对 于 中 级 水 平 的 DBA 来 说 是 个 不 错 的 选择 。 

除了 读书 外 , 还 有 很 多 问题 是 书本 上 无 法 回答 的 ， 所 以 我 也 在 互联 网 上 查找 更 多 关于 Oracle 
内 部 原理 的 文档 ， 通 过 Google 和 百度 去 搜索 更 多 的 Oracle 技术 网 站 。http://ixora.com.au 是 一 个 
相当 不 错 的 网 站 ， 上 面 有 很 多 关于 Oracle 内 部 原理 的 资料 ， 虽 然 资料 基本 上 都 是 基于 Oracle 8 
的 , 但 是 资料 十 分 权威 。ASKTOM 网 站 也 是 这 段 时间 我 经 常 访问 的 网 站 。 最 初 知道 ASKTOM 是 
通过 Google 搜索 的 时 候 ， 基 本 上 都 有 链接 指向 ASKTOM， 从 ASKTOM 我 学 到 了 Tom 分析 问 题 
的 思路 和 方法 ， 这 对 于 我 今后 自己 处 理 问 题 是 很 有 帮助 的 。 

至 于 国内 的 网 站 ， 那 时 候 ITPUB 和 oracle.com.cn 比较 热门 ， 开 始 的 时 候 也 经 常 在 这 两 个 网 
站 上 讨论 一 些 技术 问题 。 随 着 这 两 个 网 站 上 一 批 DBA 的 水 平 越 来 越 高 ， 这 两 个 网 站 上 技术 交流 
的 质量 却 越 来 越 低 。 我 也 很 难 在 这 两 个 网 站 上 找到 所 需要 的 资料 ， 于 是 把 目标 转向 了 英文 网 站 。 
国外 的 Oracle 技术 网 站 很 多 ,不 过 大 多 数 都 是 会 员 制 的 收费 网 站 ,少量 免费 网 站 (比如 ITToolbox) 
上 面 的 技术 水 平 又 普遍 比较 低 ,所 以 找 了 一 圈 , 最 后 还 是 觉得 学 习 Oracle 最 好 的 网 站 还 是 Metalink。 
由 于 朋友 的 帮助 , 这 段 时 间 获 得 了 不 少 Oracle 内 部 的 技术 资料 。 通过 学 习 这 些 资 料 , 我 很 深入 地 
了 解 了 Oracle 内 部 的 一 些 算法 。 这 些 学 习 过 程 对 我 突破 这 个 瓶颈 起 到 了 至 关 重 要 的 作用 。 

在 突破 这 个 瓶颈 的 阶段 , 我 的 学 习 方 法 是 对 于 某 一 个 知识 点 , 深入 地 研究 下 去 ,并 尽 可 能 地 
把 相关 知识 点 融会 贯通 , 特别 是 两 个 知识 点 的 结合 部 。 为 了 了 解数 据 块 的 结构 ,我 花 了 相当 长 的 
时 间 去 转 储 数据 块 ， 其 至 编写 了 一 些小 程序 去 读 取 数据 块 中 的 数据 , 这 时 以 前 搞 开 发 时 沉淀 下 来 
的 深厚 的 C 语 言 功底 起 到 了 很 好 的 作用 。 对 于 绝 大 多 数 DBA 来 说 ， 完 成 好 日 常 工作 并 不 需要 学 
习 那 么 多 内 部 原理 性 的 东西 , 不 过 如 果 你 有 兴趣 并 且 有 足够 的 时 间 , 深入 研究 Oracle 的 内 部 结构 
和 原理 是 十 分 有 趣 的 事情 。 至 少 对 我 来 说 是 这 样 的 , 从 bug 报告 生 涩 的 文字 和 少量 的 内 部 代码 里 
分 析 Oracle 内 部 实现 的 原理 ,和 看 一 部 好 的 小 说 一 样 有 趣 。 上 大 学 时 和 刚 毕 业 时 喜欢 看 一 些 散文 
和 诗歌 ,而 现在 我 阅读 的 对 象 除了 轻松 的 商业 小 说 外 , 就 只 剩 下 Metalink 文档 了 。 这 是 一 个 爱好 
问题 ， 可 以 说 已 经 与 Oracle 技术 无 关 了 。 

对 于 绝 大 多 数 DBA 来 说 , 可 能 他 们 缺少 实践 的 机 会 , 这 对 于 DBA 这 个 职业 来 说 是 十 分 致命 
的 ， 可 能 会 影响 到 DBA 的 成 长 。 我 第 一 次 做 优化 项 目 时 ， 虽 然 说 那 时候 我 已 经 具备 了 很 深 的 理 
论 知 识 ， 从 事 Oracle 维护 工作 也 有 几 年 的 时 间 了 , 但 在 项 目 一 开始 , 还 是 碰 到 了 很 多 意 想不到 的 
困难 ,其 至 有 时 候 出 现 了 方向 上 的 偏差 。 这 实际 上 和 实际 工作 经 验 是 息息相关 的 ， 哪怕 你 的 理论 
水 平 再 高 , 没有 真正 做 过 几 个 优化 项 目 , 是 很 难 真正 理解 什么 叫 优化 的 。 对 于 缺乏 实际 工作 经 验 
的 DBA, 在 ITPUB, Metalink, OTN 等 论坛 或 者 QQ 群 里 帮助 别人 解决 问题 是 一 个 十 分 好 的 办 
法 。 你 可 能 会 碰 到 各 种 各 样 的 案例 ， 它 们 都 是 你 在 目前 的 工作 环境 中 无 法 碰 到 的 。 通 过 接触 这 些 
实际 案例 ， 可 以 弥补 你 在 实际 工作 经 验 上 的 不 足 。 从 2004 年 起 ， 我 建立 了 自己 的 Oracle 讨论 群 
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“和 白 鳝 的 洞穴 ”， 在 这 个 群 里 ， 帮 助 网 友 解 决 问题 是 一 件 十 分 有 趣 的 事情 。 

当 你 通过 了 OCP 甚至 OCM 认证 考试 后 , 你 的 理论 知识 积累 已 经 达到 了 一 定 的 程度 。 这 个 时 
候 ， 如 果 你 不 能 从 事 相 应 的 工作 , 在 这 些 工 作 中 把 你 的 理论 知识 消化 并 融入 你 的 思维 当中 , 这些 
理论 知识 很 快 就 会 在 你 的 头脑 中 消失 。 一 两 年 后 ， 这 些 理论 知识 就 会 被 忘 得 干 干净 净 。 所 以 说 ， 
通过 认证 考试 不 是 目的 , 只 是 一 个 过 程 。 当 然 拥 有 OCM 证 书 , 会 给 你 的 职场 生涯 带 来 很 多 好 处 。 
不 过 认证 考试 只 是 一 个 方面 ， 深入 实践 是 更 为 重要 的 。 我 见 过 不 少 拥有 OCM 证 书 的 人 ， 他 们 有 
些 已 经 在 企业 里 做 管理 了 ， 一旦 离开 DBA 生产 的 第 一 线 半 年 或 者 一 年 以 后 ， 这 些 人 也 和 普通 的 
DBA 没有 多 少 区 别 了 。 因 此 ， 作 为 一 名 DBA， 如 果 你 想 一 直 保 持 你 的 技术 水 平 ， 不 要 离开 生产 
一 线 是 十 分 关键 的 。 这 当然 又 是 一 个 悖 论 了 。 对 于 绝 大 多 数 人 来 说 ，DBA 只 是 一 个 职业 ,一 个 
谋生 手段 而 已 , 技术 只 是 获得 提升 的 手段 ， 而 生活 才 是 永恒 的 话题 。 对 于 我 来 说 ，Oracle 是 一 种 
爱好 ， 是 一 种 生活 方式 ， 所 以 我 最 终 选 择 放 弃 了 在 大 企业 做 高 级 技术 管理 的 职位 ， 去 从 事 一 个 和 
Oracle 密切 相关 的 职业 。 而 对 于 绝 大 多 数 人 来 说 ， 完 全 没有 必要 这 么 执着 和 痴迷 ，Oracle 只 是 生 
活 的 一 部 分 ， 而 不 是 全 部 。 

理论 知识 的 学 习 是 十 分 枯燥 的 , 很 少 有 人 愿意 一 遍 一 遍地 阅读 Oracle Concepts, 虽然 这 么 做 
对 你 的 Oracle 理论 知识 的 提升 帮助 很 大 。 和 我 同龄 的 人 也 许 还 会 记得 一 款 很 经 典 的 游戏 “金庸 群 
侠 转 " ， 这 个 游戏 里 最 牛 的 武功 是 什么 ? 不 是 鞭 花 宝典 ， 也 不 是 独孤 剑 法 ， 而 是 主人 公 刚 出 生 就 
会 的 一 种 拳术 “野球 拳 "， 这 种 拳法 的 1~9 级 都 平淡 无 奇 ， 不 过 只 要 练 到 10 级 就 突然 变 得 无 坚 
不 挫 了 。 实 际 上 研究 Oracle Concepts 也 是 一 样 ， 如 果 我 们 能 够 通过 反复 阅读 ， 把 Oracle 的 概念 
融会 贯通 ， 一 样 能 够 起 到 “野球 拳 ” 的 效果 。 

对 于 初学 者 来 说 , 还 有 一 点 要 注意 。 那 就 是 Oracle 的 知识 面 很 广 , 一 个 人 也 很 难 有 机 会 把 所 
有 的 Oracle 知识 都 认真 地 梳理 学 习 一 遍 , 因此 我 们 在 学 习 时 要 注意 抓 住 重 点 , 不 能 胡子 眉毛 一 起 
抓 。 在 DBA 学 习 的 初期 ， 尽 可 能 拓宽 知识 面 ， 了 解 Oracle 的 方方面面 ， 而 一 个 名 资深 DBA 会 
在 某 些 方 面 可 能 有 十 分 深入 的 研究 , 但 是 在 大 多 数 知识 点 上 可 能 只 能 点 到 为 止 , 甚至 只 能 简单 地 
了 解 ， 直 到 需要 的 时 候 才 可 能 去 深入 分 析 。 

在 这 个 阶段 给 别人 讲课 是 学 习 理 论 的 一 个 很 好 的 途径 , 我 有 一 些 知 识 就 是 通过 给 别人 培训 学 
习 的 ， 比 如 说 Data Guard， 对 于 Data Guard 的 原理 ,我 大 体 了 解 ， 这 是 从 重 做 日 志 的 结构 方面 可 
以 推断 出 来 的 , 但 是 对 具体 的 一 些 技术 细 布 以 及 实现 方法 就 知之 其 少 了 。 有 一 次 需要 给 一 个 客户 
Wf Data Guard 的 课程 , 我 花 了 差不多 两 天 的 时 间 来 整理 培训 讲义 , 并 且 准 备 了 一 个 学 生 实 际 操作 
用 的 实验 包 ， 设 计 了 几 个 常见 的 演练 场景 。 通 过 这 个 备课 过 程 ， 对 Data Guard 的 原理 、 配 置 管理 
和 维护 的 基本 操作 就 了 解 得 十 分 清楚 了 。 几 年 过 去 了 , 虽然 Data Guard 的 技术 在 不 断 演进 ,我 在 
这 几 年 里 也 没有 做 过 Data Guard 的 项 目 , 但 是 通过 那 次 讲课 ，Data Guard 已 经 深 深 融入 了 我 的 血 
液 里 ， 再 也 不 会 忘记 了 。 随 着 数据 库 新 版 本 的 推出 ，Data Guard 技术 在 不 断 演进 ， 不 过 其 主体 技 
术 是 不 会 发 生 大 的 变化 的 , 因此 在 有 了 一 定 基础 后 ， 只 需要 你 在 使 用 前 再 去 复习 一 遍 相关 知识 就 
足够 了 。 

有 些 知识 点 可 能 平时 不 会 注意 , 但 是 如 果 你 要 给 别人 讲课 , 就 需要 你 认 认真 真 地 把 这 些 知识 
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点 一 个 一 个 搞 清楚 ， 因 为 没有 一 位 老师 愿意 在 课堂 上 被 学 生 们 问 得 哑 口 无 言 。 记 得 刚刚 工作 时 ， 
公司 派 我 给 一 个 客户 讲 RDB 数据 库 ， 在 这 之 前 我 连 RDB 数据 库 是 什么 都 不 知道 。 那 时 候 正在 
DEC 公司 ， 老 板 是 香港 人 ， 给 我 留 下 一 本 讲义 和 一 本 RDB 的 参考 手册 ， 给 了 我 3 天 时 间 准 备 。 
那 是 一 项 十 分 艰苦 的 任务 , 我 给 客户 讲 了 近 10 天 的 RDB 课程 ,每 天 晚上 我 通过 阅读 讲义 和 参考 
手册 备课 ， 对 于 讲义 上 的 每 个 实验 都 要 自己 先 做 一 遍 ， 第 二 天 再 教 给 学 员 们 。10 天 的 课程 终于 
讲 完 了 ， 没 有 一 名 学 员 看 出 我 也 是 第 一 次 学 习 RDB。 通 过 那 次 讲课 ， 我 对 RDB 数据 库 的 了 解 比 
公司 里 其 他 员工 都 要 深 。10 多 年 后 的 一 天 ， 在 一 个 客户 那里 听 说 他 们 的 一 个 RDB 数据 库 里 有 一 
批 很 重要 的 数据 想 搞 出 来 ,但 没有 人 懂 ， 所 以 只 能 通过 应 用 程序 显示 在 终端 上 ， 然 后 由 一 人 一 点 
一 点 地 抄 下 来 。 我 听 说 后 ， 赁 着 那 次 讲课 对 RDB 留 下 的 印象 ， 很 快 就 帮 用 户 把 数据 导 成 文本 格 
式 ， 然 后 通过 SQL Loader 装载 到 了 Oracle 数据 库 里 。 

最 后 要 重申 的 是 , DBA 是 一 个 工作 , 一 个 还 算 不 错 的 工作 , 但 是 并 不 是 每 个 人 都 需要 把 DBA 
当做 一 种 生活 。 因 此 ， 对 于 技术 的 追求 并 不 是 每 个 人 的 生活 目标 。 如 果 你 喜欢 Oracle， 那 你 不 妨 
把 阅读 枯燥 的 理论 知识 和 干涩 的 trace 文件 当成 一 种 乐趣 ， 否 则 就 把 它 当 成 一 种 工作 ， 一 种 生活 
中 的 点 级 吧 。 


DBA 的 性 格 


不 一 定 任何 人 都 需要 从 事 DBA 这 个 工作 ， 也 不 是 每 个 人 都 能 成 为 优秀 的 DBA。DBA 是 一 
种 压力 相对 比较 大 的 职业 ， 要 求 从 业 人 员 在 工作 期 间 不 断 地 学 习 新 技术 。Oracle 数据 库 每 5 年 左 
右 会 进行 大 版 本 升级 ， 这 就 需要 DBA 不 断 地 学 习 新 知识 。 记 得 几 年 前 在 做 一 个 项 目 时 ， 和 一 位 
干 了 七 八 年 的 老 DBA 一 起 聊天 , 他 说 本 来 想 好 了 ,Oracle 9i 的 技术 就 不 去 学 习 了 , 就 吃 Oracle 8i 
WERT, 不 过 没 办 法 , 想 要 生存 , 必须 去 学 习 。 最 后 他 说 他 的 最 大 愿望 是 不 要 再 去 学 Oracle 10g 
的 东西 了 。 不 过 愿望 只 是 愿望 ， 两 年 后 ， 我 看 到 他 出 差 时 带 着 一 本 Oracle 10g 的 书 ， 就 说 起 了 那 
次 对 话 。 他 也 只 能 笑 着 说 , 干 DBA 的 都 是 苦命 人 ， 不 学 习 是 不 可 能 的 。DBA 这 个 职业 可 以 做 得 
很 长 ， 国 外 一 些 高 手 和 大 师 都 是 从 事 DBA 工作 超过 20 年 的 。 不 过 对 于 绝 大 多 数 朋 友 来 说 ，DBA 
只 是 职业 生涯 中 的 一 个 台阶 而 已 ， 因 此 在 做 职业 规划 时 ， 首 先 你 需要 考虑 DBA 是 作为 一 种 过 渡 
性 的 工作 呢 ， 还 是 作为 一 种 生活 和 爱好 。 

要 回答 这 个 问题 ， 就 需要 根据 自身 的 性 格 来 考虑 了 。 有 几 种 性 格 是 不 适合 做 DBA 的 。DBA 
需要 谨慎 的 态度 ， 如 果 你 的 性 格 比 较 急躁 ， 那么 DBA 不 是 适合 你 的 工作 。DBA 承担 了 企业 中 最 
为 重要 的 数据 库 的 维护 ， 其 工作 性 质 决 定 了 DBA 是 一 种 压力 十 分 大 的 职业 。 在 处 理 日 常 工作 以 
及 突 发 性 问题 时 ， 急 躁 是 最 为 可 怕 的 性 格 ， 越 是 碰 到 紧急 的 问题 ， 越 需要 DBA 以 冷静 的 心态 来 
面 对 ， 否 则 很 容易 出 现 不 必要 的 问题 。2004 年 美国 的 一 项 调查 表明 ， 超 过 30% 的 系统 故障 是 由 于 
维护 人 员 人 为 失误 造成 的 ， 因 此 沉稳 的 性 格 是 DBA 减少 出 现 操 作 失 误 的 一 个 重要 保证 。 

除了 过 于 急躁 外 ， 好 奇 心太 强 的 人 也 不 适合 做 DBA, DBA 在 做 维护 工作 时 ， 经 常会 磁 到 一 
些 莫名 其 妙 的 事情 ， 和 自己 工作 无 关 的 事情 尽量 不 要 做 ， 这 是 铁 的 纪律 。Oracle 公司 的 工程 师 到 
客户 现场 工作 时 , 一 般 会 拒绝 客户 提出 的 和 本 次 任务 无 关 的 工作 , 这 也 是 Oracle 原 厂 服务 经 常 被 
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客户 诉 病 的 一 点 。 不 过 我 认为 这 是 一 种 很 职业 的 态度 ， 我 只 做 和 我 工作 相关 的 事情 。 从 另外 一 个 
角度 来 说 ， 作 为 一 名 负责 任 的 DBA， 从 职业 的 态度 来 考虑 问题 ， 就 是 做 自己 技术 能 力 范 围 内 的 
事情 。 有 些 DBA 无 法 判断 某 个 操作 的 风险 ， 在 这 种 情况 下 ， 客 户 让 你 做 某 件 事情 ， 你 到 底 是 做 
还 是 不 做 呢 ?” 最 好 的 方式 是 通过 向 专家 咨询 ,确认 没有 问题 后 再 去 做 。 而 往往 在 实际 工作 中 ,大 
多 数 DBA 都 会 尝试 干 一 些 自己 没有 把 握 的 事情 。 一 名 好 奇 心 很 强 的 DBA， 可 能 发 现 了 一 个 新 的 
脚本 , 就 很 急迫 地 想 在 自己 维护 的 生产 库 上 尝试 一 下 ,可 能 他 根本 没有 去 考虑 这 个 脚本 是 否 存 在 
风险 。 实际 上 , 在 我 这 10 多 年 的 DBA 工作 中 , 也 多 次 出 现 了 由 于 好 奇 心 强 导 致 做 一 些 自己 认为 
没有 风险 的 事情 , 结果 或 多 或 少 地 造成 了 一 些 问题 , 甚至 有 一 次 我 在 一 个 客户 的 生产 库 上 尝试 一 
个 以 前 没有 做 过 的 转 储 命令 ， 最 终 碰 到 了 一 个 Oracle 的 bug， 导 致 RAC 的 一 个 节点 宕 机 。 从 那 
以 后 , 哪怕 再 好 奇 ， 我 也 会 先 充 分 评估 操作 的 风险 ,并 且 尽 可 能 不 去 做 一 些 和 自己 工作 无 关 的 分 
析 。 实 际 上 ， 作 为 一 名 DBA， 是 很 难 经 得 起 诱惑 的 ， 因 为 有 很 多 情况 可 能 你 一 辈子 也 磁 不 上 几 
回 。 作 为 一 个 爱好 Oracle 的 人 ， 磁 到 了 某 种 现场 ， 都 可 能 会 被 吸引 ， 甚 至 诱惑 。 作 为 DBA， 经 
HERE, ETO HE. MAF EDEL, DBA 需要 足够 的 职业 素养 ,由 于 DBA 工作 的 风 
险 十 分 高 , 任何 一 个 违背 职业 素养 的 工作 习惯 都 可 能 演变 为 工作 中 的 失误 ,因此 做 一 个 真正 的 职 
业 人 是 十 分 关键 的 。 

除了 上 面 讲 到 的 沉稳 ，DBA 也 需要 有 决断 的 性 格 。 这 似乎 有 些 矛 盾 ， 我 们 虽然 强调 DBA 不 
能 胆子 太 大 ， 但 是 在 某 些 情况 下 ，DBA 必须 决断 。 有 一 次 客户 的 数据 库 出 现 了 严重 的 问题 ， 导 
致 宕 机 ， 启 动 后 没 多 久 再 次 宕 机 ， 客 户 也 十 分 着 急 ， 由 于 时 间 十 分 紧迫 ,现场 工程 师 和 我 们 在 二 
线 做 支持 的 人 都 没有 足够 的 时 间 去 进行 分 析 , 我 当时 感觉 和 我 以 前 碰 到 的 一 个 bug 十 分 类 似 , 不 
过 从 Call Stack 来 看 ， 还 是 有 些 差别 。 当 时 现场 工程 师 不 敢 做 这 个 决定 ， 我 说 这 种 时 候 了 ， 如 果 
这 个 补丁 不 起 作用 ， 那 我 们 的 服务 也 就 做 到 头 了 。 这 种 情况 下 没有 别 的 思路 , 但 是 什么 都 不 做 肯 
定 是 不 行 的 ， 所 以 立即 打 补 丁 。 幸 运 的 是 ,补丁 打上 之 后 ， 数 据 库 恢复 正常 了 。 果 断 不 仅仅 是 一 
种 性 格 ， 这 种 情况 下 果断 是 基于 一 定 的 条 件 的 ， 因 为 我 知道 哪怕 这 个 补丁 不 能 解决 问题 ， 也 是 没 
有 副作用 的 。 对 风险 的 理解 是 果断 的 基础 。 所 以 说 这 里 所 说 的 果断 也 不 是 绝对 的 , 不 是 刚 乙 自 用 ， 
不 是 一 意 孤 行 ， 而 是 在 自己 的 知识 基础 上 的 一 种 果断 态度 。 因 为 做 出 选择 不 仅仅 是 依靠 勇气 ,而 
更 多 的 是 依靠 自己 的 底气 。 

DBA 的 责任 心 是 很 关键 的 。 一 般 来 说 ， 我 面试 一 名 DBA， 首 先 看 到 的 不 是 他 的 技术 能 力 有 
多 强 ， 而 是 他 的 工作 态度 和 责任 心 。 一 个 有 责任 心 的 人 ， 哪 怕 技 术 水 平 稍微 差 一 点 ， 也 不 容易 出 
大 问题 。 而 一 名 缺乏 责任 心 的 DBA， 不 亚 于 一 颗 定 时 炸弹 。 能 把 工作 当成 自己 事情 的 人 是 肯定 
能 够 成 为 一 名 好 的 DBA 的 。 在 很 多 情况 下 , DBA 的 工作 都 是 从 纷繁 的 表象 中 去 发 现 危险 的 存在 ， 
一 个 把 工作 当成 兰 差 事 的 人 是 很 难 做 到 这 一 点 的 。 我 平时 很 少 和 同事 发 脾气 ,唯一 的 一 次 是 因为 
一 件 小 事 ， 当 时 客户 的 一 个 系统 需要 我 们 帮助 做 一 个 健康 性 检查 ， 一 共有 10 多 套 大 型 数据 库 ， 
要 在 两 三 天 内 完成 巡 检 工作 。 当 时 有 3 个 人 一 起 参与 巡 检 ， 采用 的 方式 是 集中 采集 数据 、 集 中 编 
写 报告 的 方式 ， 这 种 方式 一 般 来 说 我 们 很 少 采 用 ， 因 为 这 种 方式 可 能 导致 巡 检 质量 下 降 ， 但 由 于 
时 间 紧 迫 ， 也 只 能 采用 这 种 权宜 之 计 了 。 在 做 巡 检 之 前 ， 我 就 和 哥 几 个 说 虽然 时 间 紧 ， 但 是 一 定 
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要 认真 。 虽 然 哥 几 个 答应 得 挺 好 ， 不 过 报告 出 来 后 ， 我 感觉 还 是 过 于 粗糙 。 我 只 好 打 回 去 让 他 们 
整改 ， 整 改 了 两 三 次 还 是 难以 让 人 满意 。 事 后 我 和 哥 几 个 说 ， 如 果 你 把 这 件 事 当成 一 个 工作 ， 确 
实 让 一 个 人 在 这 么 短 的 时 间 里 做 这 么 多 库 的 巡 检 ,难免 会 有 些 枯燥 ， 质 量 下 降 也 是 难免 的 ,但 是 
如 果 你 是 以 前 的 手工 艺 者 ,做 巡 检 就 是 我 们 的 手艺 ,你 拿 出 的 活 能 不 能 对 得 起 自己 这 点 手艺 呢 ? 
大 家 听 后 都 感触 颇 深 ,既然 我 们 吃 这 碗 饭 ， 我 们 就 应 该 拿 出 对 得 起 这 碗 饭 的 手艺 。 现代 社会 比较 
CERE. 大 家 都 是 为 了 生活 而 工作 ， 工 作 已 经 不 是 目的 而 只 是 手段 ， 这 一 点 我 也 能 够 认同 。 不 过 人 
除了 物质 的 东西 ， 总 还 是 需要 一 些 形 而 上 的 信仰 来 支撑 自己 ， 否 则 会 失去 很 多 乐趣 的 。 这 种 信仰 
就 是 手艺 人 赖 以 生存 的 基础 ， 失 去 了 这 些 信 仰 ， 把 DBA 工作 当成 纯粹 的 谋生 手段 ， 那 么 你 还 会 
为 了 解决 一 个 问题 而 兴奋 不 已 吗 ? 还 会 为 了 自己 的 失误 而 感到 局 悔 吗 ? 

每 一 个 准备 做 DBA 这 个 工作 的 人 , 无 论 自己 的 职场 规划 如 何 , 作为 DBA 就 应 该 明白 自己 承 
担 什么 样 的 责任 。 摆 在 我 们 面前 会 有 很 多 诱惑 ， 你 面 对 的 是 企业 最 为 宝贵 的 财富 一 数据库。 可 
能 你 干 一 辈子 的 收入 还 不 如 把 其 中 一 小 部 分 数据 复制 出 去 卖 给 别人 赚 得 多 , 但 是 你 必须 守住 自己 
的 信念 ， 你 必须 对 得 起 自己 ， 对 得 起 自己 的 衣食 父母 。 记 得 刚刚 工作 时 ， 我 在 DEC 软件 中 心 帮 
助 香港 氧气 公司 移植 他 们 的 核心 业务 系统 ， 我 负责 的 工作 就 是 将 香港 氧气 公司 的 TME 数据 库 里 
的 数据 移植 到 OpenVMS 的 RMS 数据 库 中 去 。 我 第 一 次 接触 数据 之 前 ， 老 板 让 我 签署 了 一 个 保 
密 协 议 ， 他 当时 对 我 说 ,“ 这 些 数据 ， 随 便 拿 出 一 些 ， 你 就 可 以 卖 出 儿 十 万 的 价钱 ， 但 是 我 相信 
你 不 会 这 么 做 。 作 为 职场 中 的 人 ， 这 是 最 起 码 的 道德 底线 ， 今 后 你 可 能 会 遇 到 很 多 类 似 的 事情 ， 
只 要 你 一 次 触动 了 底线 ， 那 就 万 劫 不 复 了 。 作为 DBA， 那 根 底线 是 绝对 不 能 突破 的 ， 这 不 仅仅 
是 道德 问题 ， 实 际 上 这 个 底线 是 对 我 们 最 好 的 保护 。 

一 个 人 的 性 格 是 天 生 的 , 不 过 也 是 可 以 改变 的 , 如 有 果 一 个 人 想 去 做 一 件 事情 ,并且 不 断 地 在 
努力 , 成 功 的 机 会 是 很 大 的 。 连 郭靖 这 种 春 笨 如 牛 的 人 都 可 以 成 为 一 代 宗 师 , 你 想 成 为 一 名 DBA 
又 有 何 难 呢 。 虽 然 说 不 是 所 有 的 人 都 适合 做 DBA， 不 过 这 一 切 对 于 一 个 努力 的 人 来 说 ， 都 不 成 
问题 。 性 格 是 可 以 改变 的 ， 习 惯 是 可 以 改变 的 ， 为 了 自己 的 目标 ， 可 以 改变 一 切 的 人 ， 还 有 什么 
不 能 实现 吗 ? 我 们 公司 有 一 个 小 伙 子 ,性 格 极为 内 向 ， 和 同事 在 一 起 上 班 ， 可 以 一 天 只 说 一 两 名 
话 ， 其 至 一 句 话 也 不 说 。 有 一 次 去 客户 现场 工作 了 两 个 多 月 ， 我 们 给 他 一 个 额外 的 任务 ， 那 就 是 
请 客户 的 DBA 吃 一 顿 饭 。 就 是 这 么 一 个 很 小 的 任务 ， 他 最 后 都 没有 完成 。 按 理 说 ， 这 种 性 格 的 
人 是 很 难 成 为 一 名 合格 的 DBA 的 ， 因 为 DBA 需要 和 别人 沟通 。 作 为 DBA， 三 分 靠 技术 ， 七 分 
靠 沟 通 。 就 是 这 样 一 个 内 向 的 人 ， 在 大 家 的 努力 下 ， 通 过 一 年 的 时 间 ， 居 然 有 了 很 大 的 改变 ， 首 
先是 和 自己 同事 之 间 的 沟通 多 了 起 来 ,和 客户 之 间 的 交流 也 逐渐 好 了 起 来 。 虽然 和 其 他 工程 师 比 
较 ， 他 还 是 属于 沉默 寡言 的 那 一 类 人 ， 但 可 以 看 出 ， 他 一 直 很 努力 地 克服 自己 的 瓶颈 ， 而 且 我 们 
也 看 到 了 他 的 努力 所 得 到 的 成 果 。 我 想 再 有 一 两 年 的 时 间 ， 他 会 成 功 的 。 这 里 我 举 这 个 例子 就 是 
想 说 DBA 的 最 后 一 个 也 是 最 重要 的 性 格 一 一 坚持 。 大 家 应 该 都 看 过 《士兵 突击 》, 许三多 不 是 一 
个 当 兵 的 料 ， 不 过 他 在 战友 的 帮助 下 ， 一 直 坚 持 着 ， 最 后 成 就 了 兵 王 。 在 这 个 故事 里 ， 有 两 个 重 
要 的 要 素 ， 一 个 是 许三多 的 坚持 ， 一 个 是 战友 的 坚持 。 钢 七 连 的 “不 抛弃 ， 不 放弃 ”的 信念 是 成 
功 的 关键 。 对 于 一 个 刚刚 走 入 职场 想 成 为 一 名 成 功 DBA 的 人 ， 这 个 信念 尤为 重要 。 
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学 习 Oracle 的 方法 


经 常 有 人 问 我 如 何 学 习 Oracle 数据 库 , 每 个 人 所 处 的 环境 不 同 , 所 以 学 习 方 法 也 不 同 。 每 一 
名 成 功 的 DBA 可 能 都 有 自己 成 功 的 道路 ， 但 并 不 是 每 个 人 的 成 功 之 路 都 是 可 以 完全 借鉴 的 。 学 
>] Oracle 数据 库 技术 ,除了 用 功 外 ， 有 很 多 小 技巧 是 一 定 要 注意 的 ， 否 则 你 就 会 事倍功半 。 

Oracle 数据 库 的 理论 知识 相当 复杂 ， 而 且 技 术 体系 也 越 来 越 庞杂 ， 对 于 一 个 初学 者 来 说 ， 很 
难 抓 到 学 习 的 要 点 ， 往 往 会 觉得 自己 也 很 努力 ， 但 是 成 效 不 佳 。 在 学 习 的 过 程 中 ， 有 两 点 是 要 注 
意 的 ， 一 是 理论 结合 实践 ， 二 是 在 工作 中 学 习 。 当 你 学 习 Oracle 数据 库 时 ， 可 能 首先 会 通过 看 书 
来 学 习 ， 看 书 是 学 习 的 最 好 方法 之 一 ， 但 学 习 并 不 仅仅 是 看 书 。 在 看 书 的 过 程 中 ， 如 果 你 不 能 把 
学 到 的 知识 实践 一 下 , 那么 很 可 能 在 你 刚刚 看 完 一 本 书 时 ,对 这 本 书 的 前 半 部 分 已 经 忘 得 差不多 
了 。 如 果 一 边 看 书 一 边 实 践 ， 学 习 效果 就 会 成 倍 地 提高 。 如 果 你 能 够 在 工作 中 学 习 ， 那 么 你 的 学 
习 效 果 将 会 是 最 好 的 。 因 为 工作 中 碰 到 的 问题 会 让 你 去 思考 ， 并 且 在 思考 中 才 会 有 更 大 的 收获 。 
前 几 天 和 一 个 以 前 的 同事 一 起 吃饭 ， 他 就 说 :“ 老 白 ， 你 以 前 总 是 让 我 们 把 做 过 的 事情 认 认真 真 
地 写 下 来 ， 当 时 我 们 都 不 以 为 然 ， 觉 得 做 都 做 了 ， 写 下 来 有 什么 用 ， 这 段 时 间 我 比较 有 空 ， 就 昭 
着 你 的 方法 试 了 一 下 ， 发 现 效果 确实 很 好 ， 写 下 来 的 过 程 实际 上 是 一 个 知识 梳理 的 过 程 , 在 写 的 
过 程 中 也 会 发 现 一 些 知识 点 存在 盲区 , 这样 就 会 去 补充 一 下 , 等 把 这 个 处 理 过 程 完整 地 写 下 来 时 ， 
我 发 现 又 学 到 了 不 少 东 西 ， 而 且 通 过 这 么 一 写 ， 记 得 就 更 牢 了 。” 我 们 小 时 候 老 师 经 常 说 一 句 话 
“好 记性 不 如 烂 笔头 ”, 建议 我 们 多 写 , 多 记 笔 记 。 实际 上 我 们 在 做 一 件 事 时 往往 更 加 注重 其 结果 ， 
而 会 忽略 很 多 过 程 性 的 东西 , 如 果 做 完 后 , 能 够 系统 地 写 下 来 , 对 你 的 能 力 的 提高 是 很 有 帮助 的 。 
我 经 常 要 求 公司 里 的 弟兄 们 整理 知识 库 ， 只 要 他 们 有 空 时 , 我 都 会 发 起 一 个 知识 整理 的 活动 。 知 
识 整理 不 仅仅 是 为 企业 积累 核心 价值 ， 对 于 每 个 参与 这 项 工作 的 人 ， 都 会 从 中 受益 。 

有 一 次 我 正在 超市 里 买 东西 ， 公 司 里 的 一 个 小 伙 子 打 电 话 给 我 ， 说 发 现 客户 有 个 数据 库 的 
CPU 100% 了 , 从 Top 上 看 到 的 都 是 Oracle 进程 占用 了 大 量 的 CPU 资源 。 那 个 小 伙 子 是 今年 刚刚 
参加 工作 的 毕业 生 ， 虽 然 几 个 月 前 通过 了 OCP 考试 ， 但 临场 应 变 能 力 以 及 知识 积累 方面 还 存在 
很 多 不 足 ， 对 于 日 党 的 维护 工作 基本 能 够 胜任 ， 碰 到 一 些 紧急 故障 还 是 感到 无 从 下 手 。 我 就 问 他 
做 了 什么 分 析 ， 他 说 从 v$session wait 里 发 现 大 量 的 latch free 等 待 ， 由 于 是 Oracle 8i 的 数据 
库 ， 等 待 事件 并 没有 明确 是 什么 门 锁 。 我 问 他 知 不 知道 怎么 通过 latch free 的 参数 找到 是 哪个 门 
锁 , 他 说 好 像 以 前 看 到 过 , 记 不 起 来 了 。 我 说 查看 一 下 P1、P2 和 了 3 参数 的 说 明 就 知道 怎么 做 了 ， 
而 且 现 在 需要 做 一 个 STATSPACK 报告 ， 我 怀疑 这 种 情况 下 出 现 latch free 等 待 ， 很 可 能 是 cache 
buffers chains 等 待 。 几 分 钟 后 ， 他 打 电 话 告诉 我 ， 确 实 是 cache buffers chains 等 待 ， 是 通过 P2 Z 
数 找到 的 。 我 告诉 他 cache buffers chains 一 般 来 说 是 由 于 大 量 的 缓冲 区 获取 引起 的 ， 我 问 他 下 一 
步 该 怎么 做 ?他 说 :“ 是 不 是 可 以 杀 掉 CPU 消耗 比较 高 的 那儿 个 进程 ”” 我 说 :“ 可 以 ,不 过 首 
先 要 搞 清楚 是 哪些 进程 ， 这 些 进 程 是 前 台 的 还 是 后 台 的 ， 是 做 什么 的 ? ”后 来 他 发 现 有 个 SNPI 
进程 CPU 开销 很 大 ， 我 问 SNP1 是 什么 进程 ， 知 道 吗 ? 他 说 以 前 好 像 学 过 ， 现 在 也 记 不 起 来 了 。 
我 告诉 他 ， 是 一 个 和 Job 相关 的 进程 。 后 来 他 和 客户 确认 了 这 个 Job 可 以 暂停 ,晚上 再 跑 ， 就 把 
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这 个 进程 杀 了 。 在 杀 掉 进程 后 ，CPU 还 是 十 分 高 ， 又 有 一 批 高 开销 的 进程 跑 了 出 来 ,而 且 这 些 进 
程 经 常会 变 。 他 又 打 电 话 来 问 我 ， 我 说 这 时 候 应 该 先 看 看 STATSPACK 报告 ,关键 是 注意 缓冲 区 
获取 排 在 前 几 位 的 SQL, 打 完 这 个 电话 后 很 久 , 他 也 没有 再 给 我 打 电话 ,后 来 中 午 吃饭 时 他 给 我 
打 了 一 个 电话 说 这 个 故障 解决 了 , 在 STATSPACK 报告 中 看 到 了 一 个 SQL， 在 不 到 10 分 钟 的 时 
间 里 执行 了 13 000 Zx, ET 95% 的 缓冲 区 获取 ， 后 来 客户 发 现 新 上 的 一 个 模块 里 面 有 个 循 
环 写 错 了 ， 写 成 了 死 循环 ， 把 那个 应 用 停 了 ， 问 题 就 解决 了 。 我 鼓励 了 他 一 番 ， 然 后 告诉 他 ， 希 
望 他 根据 这 个 案例 ， 整理 一 些 知识 点 : 一 是 碰 到 CPU 瓶颈 时 该 如 何 处 理 ; 二 是 latch free 问题 如 何 
Zr. 三 是 每 个 后 台 进 程 是 干什么 的 。 因 为 这 3 个 知识 点 是 他 今天 解决 这 个 问题 的 关键 ,也 正 是 
他 暴露 出 来 不 足 的 地 方 。 今 后 遇 到 类 似 的 问题 ， 如 果 这 3 个 知识 点 没有 和 掌握， 还 是 两 上 腿 一 抹黑 。 

记得 以 前 联想 关于 ISO 9001 有 3 句 很 著名 的 话 就 是 :“ 把 要 做 的 事情 想 请 楚 ， 把 想 好 的 事情 
做 出 来 ， 把 做 过 的 事情 写 下 来 。” 这 3 句 话 在 DBA 身上 也 同样 适用 ， 绝 大 多 数 DBA 都 没有 整理 
知识 的 习惯 。 很 多 DBA 都 会 感觉 自己 的 知识 积累 很 慢 ， 实 际 上 应 该 从 自身 的 角度 去 找 找 原因 ， 
每 次 实践 的 机 会 都 是 很 好 的 学 习 机 会 ,而 不 同 的 人 在 每 次 实践 中 获得 的 成 果 是 不 同 的 。 善 于 思考 
的 人 会 从 有 限 的 实践 机 会 中 获得 更 多 的 知识 , 主要 原因 是 每 次 处 理 完 一 个 案例 后 你 是 否 能 够 认真 
地 总 结 一 下 。 不 善于 总 结 的 人 ,哪怕 下 次 碰 到 完全 相同 的 案例 ， 可 能 还 会 像 第 一 次 碰 到 一 样 手足 
无 措 ; 善于 总 结 的 人 ， 下 回 再 磁 到 类 似 的 问题 ， 都 会 游 力 有 余 。 举 一 反 三 这 个 成 语 对 于 DBA 是 
十 分 重要 的 ， 只 有 能 够 举一反三 的 人 才能 更 快 地 提高 。 

除了 实践 之 外 ， 看 书 也 是 DBA 学 习 的 重要 方式 , 现在 市 面 上 Oracle 方面 的 图 书 十 分 丰富 ,但 
EBA ithe AR, RAT. 选择 适合 自己 阅读 的 图 书 以 及 读书 的 方法 也 是 很 关键 的 。 作 
为 一 个 初学 者 , 并 不 是 任何 图 书 都 适合 你 阅读 , 循序 渐进 是 非常 重要 的 , 过 早 地 去 阅读 一 些 自 己 力 
不 能 及 的 图 书 是 有 害 无 益 的 。 对 于 一 个 表 空间 为 何 物 都 不 是 很 清楚 的 初学 者 , 学 习 调 优 或 者 内 部 原 
理 是 有 百 害 而 无 一 益 的 事情 。 实 际 上 ，Oracle 官方 文档 提供 了 一 套 很 不 错 的 技术 资料 ， 从 入 门 级 的 
2 Day DBA 系列 开始 ， 到 性 能 调 优 和 一 些 高 级 管理 技术 ， 都 面面俱到 。 初 学 者 首先 自己 搭建 一 个 测 
试 环 境 ， 然 后 按照 Oracle 入 门 书 自己 一 点 点 实践 是 一 种 很 好 的 学 习 方 法 。 书 中 看 到 的 一 些 技术 一 
定 要 自己 亲自 操作 一 下 ,然后 再 用 做 笔记 或 者 写 博客 的 方式 ,把 这 些 知识 点 用 自己 的 语言 描述 出 来 ， 
这 个 知识 点 就 算 学 完了 .学 完了 初级 入 门 的 内 容 后 , 可 以 学 习 一 下 数据 库 管 理 方面 的 一 些 基 本 操作 。 
按照 Administrators Guide 的 内 容 实践 一 遍 所 有 的 操作 是 一 个 很 好 的 选择 ， 根 据 每 个 人 的 能 力 和 可 
以 投入 时 间 的 多 少 ， 这 个 过 程 大 概 需要 几 个 月 到 一 年 的 时 间 。 

通过 这 个 阶段 的 学 习 ， 基 本 上 对 Oracle 数据 库 的 基本 操作 有 了 一 个 全 面 的 认识 ， 接 下 来 就 
可 以 去 阅读 一 本 十 分 经 典 的 图 书 了 ,这 就 是 官方 文档 里 著名 的 Oracle Concepts。 由 于 这 本 书 的 理 
论 性 特别 强 ， 所 以 阅读 起 来 很 枯燥 ， 可 能 大 多 数 DBA 都 不 愿意 认真 地 去 阅读 它 。 但 是 事实 上 ， 
阅读 这 本 书 是 很 关键 的 , 对 于 你 今后 的 DBA 生涯 会 有 较 大 的 帮助 。 这 本 书 可 以 帮 你 建立 起 Oracle 
基础 的 理论 ， 有 了 这 本 书 的 理论 知识 垫底 , 今后 学 习 Oracle 的 技术 将 会 事半功倍 。 阅读 这 本 书 可 
能 会 花费 相当 长 的 时 间 ， 而 且 这 本 书 是 需要 看 多 遍 的 ,因此 第 一 次 阅读 时 ,不 一 定 要 求 所 有 的 章 
节 都 全 部 认真 阅读 并 理解 ， 有 些 和 暂时 不 使 用 的 技术 或 者 有 些 对 于 你 来 说 过 于 深奥 的 理论 ,你 完全 
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可 以 先 跳 过 去 ， 以 后 再 回 过 头 来 阅读 。 要 注意 的 是 ， 虽 然 Oracle Concepts 是 理论 性 非常 强 的 图 
书 , 实际 上 每 个 理论 也 涉及 实际 的 操作 , 在 阅读 时 , 也 要 多 做 试验 , 以 便 加 深 对 理论 知识 的 理解 。 

阅读 完 这 本 书 以 后 ， 需 要 对 我 们 以 前 学 习 的 一 些 知识 进行 梳理 ， 这 时 候 再 去 回顾 一 下 
Administrator s Guide 中 的 相关 内 容 是 很 有 帮助 的 。 如 果 能 把 实际 操作 和 概念 融会 贯通 , 这 个 阶段 
的 目标 就 达到 了 。 在 回顾 的 过 程 中 ， 补 充 读书 笔记 ,修正 以 前 错误 的 认识 是 十 分 关键 的 。 因 为 在 
前 面 这 两 个 阶段 的 阅读 过 程 中 ， 肯 定 会 产生 很 多 错误 认识 ， 及 早 纠正 错误 认识 是 十 分 关键 的 。 

上 述 知 识 整理 阶段 结束 后 , 就 可 以 尝试 阅读 性 能 优化 相关 的 文档 了 。 实 际 上 , 性 能 优化 不 仅 
仅 是 技术 问题 , 更 重要 的 是 理念 。 学 习性 能 优化 相关 的 技术 对 于 数据 库 管理 和 维护 是 有 很 大 帮助 
的 。 学 习性 能 优化 ， 可 以 从 2 Day + Performance Tuning Guide 入 手 ， 这 份 文档 里 包含 了 数据 库 设 
计 、 管 理 、 优 化 的 一 些 最 基本 的 理念 ， 擎 握 这 些 理念 会 对 你 今后 的 维护 工作 帮助 民 多 。 官 方 的 
Performance Tuning Guide 也 是 一 本 优秀 的 图 书 ， 这 本 书 的 前 几 章 介绍 的 内 容 不 仅 适 用 于 Oracle 
数据 库 ， 甚 至 适用 于 所 有 的 数据 库 ， 作 为 应 用 软件 开发 和 架构 设计 的 参考 书 也 是 很 不 错 的 。 对 于 
初学 者 来 说 ,学 习 调 优 的 技术 ,主要 还 是 强化 一 些 理念 , 工具 和 具体 的 技术 细节 反而 不 是 最 为 关 
键 的 部 分 。 由 于 没有 实践 经 验 ， 因 此 对 这 本 书 的 阅读 不 用 特别 细致 ， 有 些 地 方 可 以 根据 自己 的 喜 
好 跳 过 ， 不 过 这 本 书 的 前 儿童 是 必须 要 认真 阅读 的 。 

通过 上 述 的 阅读 过 程 , 一 个 初学 者 已 经 具有 了 初步 的 理论 知识 和 一 定 的 实际 操作 经 验 , 如果 
你 是 从 事 数 据 库 维护 的 人 , 就 可 能 会 有 很 多 实践 的 机 会 , 下 一 步 就 是 如 何在 实践 过 程 中 运用 你 所 
学 到 的 知识 ,以 便于 将 书本 上 的 知识 转化 为 你 自己 的 。 如 果 你 不 是 从 事 数 据 库 维护 工作 的 ， 就 很 
难得 到 实践 的 机 会 ， 你 就 得 想 办 法 去 找 一 份 DBA 工作 。 在 岸上 是 学 不 会 划船 的 ， 要 想 知道 螃蟹 
的 滋味 ， 唯 一 的 办 法 是 亲自 吃 一 只 ， 因 此 要 想 成 为 一 名 真正 的 DBA， 你 必须 首先 拥有 一 份 DBA 
的 工作 。 不 过 换 工作 不 是 一 朝 一 夕 的 事情 ,或 者 你 可 以 尝试 去 考 一 下 OCP， 拿 到 OCP 证书， 可 
以 为 你 进入 DBA 行业 提供 更 多 的 机 会 ,如 果 你 暂时 还 无 法 找到 DBA 的 工作 ,那么 保持 学 习 状 态 ， 
并 且 尽 可 能 地 寻找 实践 机 会 是 十 分 重要 的 , 否则 用 不 了 半年 , 你 以 前 学 习 的 绝 大 部 分 知识 都 会 变 
得 陌生 了 。 实 际 上 ， 在 你 等 待 自 己 工作 转型 的 过 程 中 ， 还 是 有 很 多 知识 需要 学 习 。Oracle 是 一 个 
庞大 的 体系 , 其 中 的 知识 点 十 分 丰富 , 除了 数据 库 的 日 常 管理 外 , 分 布 式 环境 、 高 级 复制 、RAC、 
Streams, RIK, EM 等 都 需要 你 去 掌握 ， 这 些 都 是 DBA 经 常 要 面 对 的 技术 。 利 用 这 上 段 时 间 ， 
系统 地 学 习 和 实践 这 些 知 识 点 ， 对 于 你 今后 正式 从 事 DBA 工作 帮助 极 大 。 
在 这 种 情况 下 ,你 必须 继续 学 习 和 实践 , 通过 你 自己 搭建 的 测试 环境 , 建立 更 复杂 的 测试 环 
绕 ， 以 便于 实践 分 布 式 数 据 库 、RAC 等 方面 的 操作 。 这 时 加 入 一 些 网 上 技术 论坛 和 Oracle 专题 
的 QQ 群 是 十 分 有 用 的 。 在 这 些 群 里 和 大 家 一 起 讨论 问题 ， 帮 助 网 友 分 析 和 解决 问题 ， 是 提升 自 
己 能 力 的 好 方法 。 

对 于 有 一 定 基础 的 DBA, 或 者 已 经 从 事 了 几 年 DBA 工作 的 朋友 ,如 何 快速 提升 自己 的 技术 
水 平 是 大 家 都 很 关心 的 事情 。 除 了 我 刚才 讲 到 的 积累 知识 的 学 习 方 法 外 ， 由 于 这 部 分 朋友 是 处 在 
一 个 仆 坡 的 阶段 , 因此 除了 在 日 常 工 作 中 积累 工作 经 验 外 , 还 需要 对 Oracle 的 内 部 原理 进行 深入 
学 习 。 大 家 都 把 Oracle 性 能 调 优 看 做 高 水 准 的 工作 , 也 经 常 在 做 性 能 调 优 时 感觉 一 筹 莫 展 。 甚 主 
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要 原因 不 外 乎 两 点 : 一 是 缺乏 开发 经 验 ， 所 以 对 于 SQL 优化 无 能 为 力 ， 而 数据 库 性 能 优化 基本 
上 都 和 应 用 相关 ， 二 是 对 于 Oracle 的 基本 原理 认识 还 不 够 深刻 ， 无 法 找到 性 能 优化 的 关键 要 点 。 
这 些 问题 都 暴露 出 DBA 在 这 个 阶段 存在 的 瓶颈 。 对 于 这 个 阶段 的 DBA 来 说 ， 除 了 DBA 日 常 的 
维护 技术 外 , 还 需要 了 解 一 些 其 他 方面 的 技术 来 拓宽 视野 ,其 中 十 分 重要 的 就 是 多 了 解 一 些 开 发 
相关 的 知识 ， 包 括 软 件 架构 、 开 发 过 程 、 测 试 等 方面 的 知识 ， 其 至 需要 尝试 学 习 PL/SQL 编程 、 
SQL 编程 等 方面 的 知识 。 除 了 应 用 开发 方面 的 知识 外 , DBA 还 需要 学 习 小 型 机 、Unix 操作 系统 、 
存储 、 网 络 方面 的 知识 ， 这 些 方 面 知 识 的 匮乏 是 目前 大 多 数 DBA 的 通病 。Oracle 数据 库 不 是 孤 
立 的 ， 其 运行 环境 包括 服务 器 、 网 络 、 存 储 、 操 作 系 统 等 要 素 ， 而 上 面 运行 的 又 是 一 个 个 特定 的 
应 用 系统 ， 所 以 多 掌握 一 些 这 些 方 面 的 技术 对 于 DBA 来 说 是 很 重要 的 。 

除了 这 些 知识 外 ，Oracle 数据 库 本 身 的 一 些 基 本 原理 性 的 东西 也 是 这 个 阶段 需要 深入 了 解 
的 。 经 过 前 一 个 阶段 的 学 习 和 实践 , 我 们 基本 上 对 一 些 原理 性 的 东西 有 了 初步 的 认识 ,不 过 这 种 
认识 还 远 远 不 够 。 这 时 再 阅读 一 遍 Oracle Concepts 对 于 提升 Oracle 原理 的 认识 有 很 大 帮助 ， 并 
且 会 发 现 很 多 以 前 不 能 理解 的 问题 现在 很 好 理解 了 ， 你 会 感觉 这 次 阅读 虽然 不 是 逐 字 逐 句 地 阅 
jx, 但 是 学 到 的 东西 甚至 比 第 一 次 阅读 这 本 书 时 还 要 多 。 事 实 上 ， 随 着 你 对 Oracle 认识 的 加 深 ， 
每 次 阅读 这 本 书 ， 都 会 有 新 的 收获 。 甚 至 我 现在 偶尔 翻阅 这 本 书 的 某 些 章节 ， 还 能 从 中 体会 到 一 
些 以 前 忽略 掉 的 东西 。 在 这 之 前 , 我 们 已 经 掌握 了 大 量 的 Oracle 知识 , 这 些 知 识 是 以 点 的 形式 藏 
在 我 们 的 脑子 里 的 ,很 多 地 方 还 无 法 串 成 线 ， 连 成 面 。 所 以 这 个 阶段 是 需要 把 Oracle 的 一 些 知识 
点 贯穿 起 来 ， 把 相关 的 知识 连贯 起 来 。 比 如 ， 我 们 可 以 从 DB Cache 的 基本 功能 联想 到 服务 器 进 
程 如 何 访问 数据 块 ，hash chains 和 LRU 链 是 怎么 工作 的 ， 联 想到 数据 库 缓 冲 地 和 共享 池 的 关系 ， 
和 DBWR (数据 库 写 进程 ) 的 关系 ， 和 LGWR (日 志 写 进程 ) 的 关系 ， 等 等 。 如 果 你 能 把 这 些 
关系 都 串联 起 来 ， 那 么 今后 在 分 析 一 个 问题 时 ， 可 以 从 原理 出 发 ， 避 免 走 弯路 。 

在 这 个 阶段 ,你 能 够 接触 到 的 资料 很 少 ， 有 些 原理 性 的 东西 只 能 从 网 上 搜索 到 只 言 片 语 ,而 
且 网 上 的 资料 里 面 还 充满 了 错误 。 在 这 个 阶段 ， 加 强 DBA 之 间 的 交流 十 分 重要 。 如 果 大 家 都 能 
把 自己 手头 有 限 的 技术 资料 共享 出 来 , 大 家 一 起 来 讨论 , 那么 这 个 过 程 会 容易 得 多 。 目 前 我 正在 
粉丝 网 上 将 一 些 资料 陆续 发 布 出 来 ,如果 大 家 对 这 些 资料 有 兴趣 ， 可 以 在 粉丝 网 或 者 其 他 任何 一 
个 IT 交流 论坛 上 对 这 些 资料 进行 研讨 。 如 果 能 够 形成 一 个 很 好 的 交流 氛围 ， 对 大 家 的 进步 是 帮 
助 很 大 的 。 

这 些 年 来 经 常 有 人 让 我 推荐 几 本 书 ， 我 觉得 学 习 Oracle 最 好 的 资料 是 Oracle 的 官方 文档 以 
及 Metalink 的 “知识 库 ”(knowledgebase) , Metalink 应 该 算是 Oracle 学 习 者 最 大 的 知识 库 , Oracle 
公司 也 愿意 把 这 个 知识 库 共享 给 所 有 用 户 。 在 我 学 习 Oracle 的 几 年 时 间 里 ，Metalink 基本 上 成 为 
我 每 天 必 上 的 网 站 。 每 天 不 到 Metalink 上 看 儿 篇 技术 文档 , 我 就 觉得 像 是 缺点 什么 似 的 。 老 实说 ， 
在 我 系统 学 习 Oracle 的 过 程 中 ， 很 少 看 别人 写 的 Oracle 图 书 。 除 了 认真 阅读 Oracle 官方 文档 ， 
我 的 Oracle 知识 绝 大 多 数 来 自 于 Metalink, 
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今天 很 匆忙 ， 通 过 次 航 确认 机 票 后 ， 就 急忙 赶 到 机 场 ， 搭 乘 了 8 : 50 的 ZH9841 前 往 沈 阳 。 
事实 上 ,对 于 这 次 旅行 我 一 点 准备 也 没有 ， 昨天 我 还 在 为 周末 带 小 孩 去 海边 做 着 准备 。 由 于 这 是 
今年 第 一 次 去 海边 , 我 特意 为 两 岁 的 儿子 买好 了 太阳 帽 、 太 阳 镜 、 游 泳 镜 和 沪 裤 ， 还 在 超市 里 大 
肆 采 购 了 一 批 儿子 最 喜欢 吃 的 食品 。 结 果 下 午 的 一 个 电话 就 使 我 不 得 不 放弃 海边 悠 亲 生活 的 计 
R, 开始 了 这 4 个 半 小 时 的 长 途 旅程 。 

沈阳 的 优化 项 目 很 早 就 提出 来 了 , 不 过 由 于 和 北方 公司 的 合同 问题 一 直 拖 着 ， 上 星期 大 家 还 
预计 这 个 项 目 要 在 6 月 中 下 旬 才 能 启动 , 谁 知 这 儿 天 风云 突变 , 实际 开工 的 时 间 比 原 计划 整整 提 
前 了 一 个 月 。 虽然 合同 还 在 走 流 程 ,但 是 为 了 配合 北方 公司 整体 的 时 间 安 排 , 辽宁 的 客户 和 我 们 
的 项 目 经 理 研究 一 番 后 ， 决 定 本 月 11 日 必须 启动 。 

北京 的 老 于 和 老 肖 已 于 昨天 晚上 登 上 54 次 列车 赶 往 沈 阳 ， 并 会 参加 上 午 的 项 目 开工 会 。 原 
本 项 目 经 理 小 齐 要 求 我 也 一 起 到 场 , 但 由 于 昨天 通知 得 太 晚 了 ， 所 以 我 只 能 今天 早上 出 发 , 尽快 
和 老 于 他 们 会 合 。 那 个 从 去 年 就 开始 谈论 的 优化 项 目 终于 要 揭 开 序幕 了 。 我 最 近 这 段 时 间 一 直 比 
较 困 ， 由 于 在 等 待 这 个 项 目 ， 也 一 直 没 有 安排 其 他 事情 ， 所 以 这 回 出 发 得 虽然 很 突然 ， 不 过 还 是 
有 一 点 冲动 的 感觉 。 好 入 没有 遇 到 这 么 刺激 的 全 面 优化 项 目 了 ! 

昨天 下 午 和 老 于 通过 MSN 聊 了 个 把 小 时 ， 讨 论 了 一 下 这 个 项 目的 做 法 。 老 于 在 做 售 前 时 去 
过 一 次 沈阳 ， 从 系统 中 采集 了 部 分 数据 ， 他 的 第 一 印象 是 ， 这 个 项 目 难 度 很 大 ， 因 为 主要 的 系统 
资源 均 出 现 了 不 足 。 由 于 他 急 着 去 火车 站 ,所 以 也 没有 更 多 的 时 间 进 行 交 流 ， 最 后 老 于 把 前 儿 次 
他 采集 的 一 系列 数据 通过 MSN 发 给 了 我 。 

次 圳 飞 沈 阳 是 十 分 瘟 长 的 旅行 ,中 间 经 停 南京 。 在 飞机 上 吃 过 早餐 后 ， 我 就 打开 老 于 发 来 的 
资料 ， 简 单 浏览 了 一 下 ， 本 次 优化 涉及 的 系统 包括 计 费 、 账 务 和 综合 客服 3 大 系统 ， 几 乎 涵盖 了 
客户 业务 的 主要 系统 。 从 STATSPACK 报告 和 OSWATCH 的 信息 来 看 , 3 套 系统 都 存在 CPU, 1/0 
KAF 3 方面 的 资源 问题 。CPU 使 用 率 经 常 在 100% 的 高 位 ， 有 几 套 系统 VO 也 好 像 有 些 问 题 ， 
而 且 空闲 内 存 只 剩 下 几 十 兆 。 从 这 些 数据 上 看 ， 这 又 是 一 个 十 分 棘手 的 项 目 ， 怪 不 得 小 齐 这 回 这 
么 大 的 手笔 ， 老 于 、 老 肖 、 老 能 和 我 都 是 有 10 多 年 以 上 经 验 的 DBA。 昨 天 我 还 觉得 小 齐 有 点 小 
题 大 做 ,什么 样 的 项 目 需要 这 么 多 老 鸟 一 起 出 动 呢 ? 现在 看 样子 是 要 有 一 番 恶 战 了 。 小 齐 是 这 个 
项 目的 项 目 经 理 ， 是 个 女孩 。 老 于 是 项 目的 现场 负责 人 ， 有 具体 负责 项 目的 实施 。 在 这 个 项 目 里 ， 
我 的 身份 是 应 用 优化 方面 的 负责 





































































































2 Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





通过 STATSPACK 报告 来 了 解 系统 的 基本 情况 是 我 的 习惯 ， 长 期 的 优化 工作 使 我 对 
STATSPACK 产生 了 一 种 莫名 其 妙 的 依赖 证 ， 一 个 系统 如 果 不 通过 STATSPACK 报告 分 析 一 下 ， 
我 总 会 觉得 不 太 托 底 。STATSPACK 报告 里 包含 了 大 量 的 系统 状态 信息 , 只 有 过 一 遍 STATSPACK 
报告 ， 我 才能 基本 抓 住 系统 的 关键 要 素 ， 同 时 也 能 够 做 出 判断 ， 这 个 系统 到 底 能 不 能 优化 ,优化 
后 大 概 能 达到 什么 样 的 效果 。 什 么 事情 都 是 熟 能 生 巧 ， 经 过 这 些 年 的 锻炼 ， 无 论 是 什么 系统 ， 只 
要 搭 一 眼 STATSPACK 报告 ,对 于 存在 的 问题 就 基本 有 个 概念 了 。 

飞机 晚点 ,在 南京 停留 了 很 长 时 间 。 等 待 期 间 ， 我 找 了 一 个 有 电源 的 地 方 ， 打开 电脑 继续 看 
老 于 的 资料 。 直 到 下 午 4 点 多 了 ,我 才 到 达 沈 阳 ， 拖 着 行李 走 进 靠近 北 站 的 邮政 大 院 。 沈 阳 比 我 
想象 得 热 ， 在 深圳 出 发 时 穿 的 短 袖 衬衫 ,原来 还 怕 到 了 沈阳 太 冷 ,随身 带 了 一 件 夹克 衫 ,到 了 沈 
阳 才 发 现 短 袖 衬衫 居然 很 合适 ， 夹 克 衫 明显 有 点 多 余 了 。 

赶 到 邮政 大 院 时 , 老 于 已 经 在 院子 里 等 我 了 , 高 高 瘦 瘦 的 , 和 他 电话 里 的 自我 描述 十 分 一 致 。 
我 和 老 于 虽然 电话 沟通 很 多 , 不 过 见面 还 是 第 一 次 , 我 们 几 个 也 是 第 一 次 真正 在 一 起 合作 。 第 一 
次 和 老 于 通电 话 ， 老 于 说 对 我 很 景仰 ， 我 说 第 一 次 联络 ， 景 仰 大 不 敢当 了 。 老 于 说 听 老 方 说 过 海 
尔 的 事情 ， 而 且 看 过 我 做 云南 联通 优化 项 目的 文档 。 云 南 联通 是 我 和 老 方 一 起 实施 的 优化 项 目 ， 
我 昕 老 方 说 后 期 这 个 项 目 移交 给 了 他 的 一 位 同事 , 原来 老 方 说 的 同事 就 是 老 于 , 看 样子 我 们 两 个 
还 真有 点 缘分 。 

见 到 老 于 之 前 , 我 一 直 在 担心 , 把 这 么 多 老手 集中 在 一 起 , 每 个 人 都 有 自己 的 经 验 和 工作 方 
法 ,能 不 能 成 为 一 股 合力 怕 是 一 个 问题 ,我 和 老 能 在 一 起 搭档 有 一 年 多 了 ,而 和 老 于 、 老 肖 基 本 
上 是 第 一 次 碰面 , 如 果 工 作 思 路 和 工作 方法 不 一 致 , 很 可 能 导致 儿 个 人 无 法 互补 , 反而 互相 牵制 。 
这 个 项 目 老 于 是 现场 负责 人 ,我 只 负责 应 用 优化 部 分 ,而 之 前 的 所 有 优化 项 目 都 是 我 全 面 负责 的 ， 
关键 的 时 候 都 是 我 拍板 下 结论 , 我 和 老 于 能 否 很 好 合作 决定 了 这 个 项 目的 成 败 。 这 些 顾虑 在 我 和 
老 于 第 一 次 会 面 后 就 烟消云散 了 。 老 于 一 边 说 话 一 边 不 停 吸 烟 ， 点 上 第 一 根 烟 后 就 很 少 用 打火机 
了 ,基本 上 是 续 着 抽 。 我 看 到 过 的 抽烟 很 厉害 的 人 往往 都 很 瘦 ， 看 样子 抽烟 对 减肥 的 功效 还 是 很 
大 的 。10 多 年 的 DBA 生涯 ， 让 老 于 成 为 一 个 十 分 谨慎 的 人 ，DBA 行业 流行 一 句 话 :“ 经 验 越 做 
越 丰 富 ， 胆 子 越 做 越 小 。 这 人 句 话 用 在 老 于 身上 十 分 贴切 。 在 来 沈阳 之 前 ， 老 方 就 和 我 说 ， 老 于 
各 方面 都 相当 不 错 ， 就 是 有 时 候 胆 子 小 了 点 ， 这 方面 需要 你 帮 他 弥补 弥补 。 对 我 来 说 ， 和 一 个 胆 
子 小 的 人 合作 是 一 件 好 事 ， 我 最 怕 和 胆子 大 的 人 合作 ，DBA 的 工作 风险 十 分 高 ， 就 是 胆子 很 小 
的 人 也 经 常会 犯 冒进 的 错误 ， 更 不 要 说 胆子 大 的 人 了 。 我 说 没 问 题 ， 这 种 项 目 ， 胆 子 越 小 ， 保 险 
系数 越 高 。 

第 一 次 和 老 于 见面 ,我 们 并 没有 进 办公 室 , 机 房 门 口 的 楼 梯 间 里 放 着 一 张 小 圆 桌 和 几 把 椅子 ， 
平时 作为 吸烟 区 使 用 。 我 们 两 个 人 就 坐 在 走廊 门口 的 吸烟 区 聊 了 起 来 。 以 前 我 抽烟 也 挺 厉害 ， 后 
来 有 一 段 时 间 咽 喉 炎 很 厉害 ， 就 彻底 戒 了 ， 所 以 我 平时 基本 不 抽烟 ， 不 过 在 外 面 做 调 优 项 目 时 我 
会 抽 一 些 。 做 项 目 时 稍微 抽 点 烟 的 好 处 还 是 老 方 告 诉 我 的 ， 老 方 说 有 时 候 在 客户 现场 ， 总 是 两 个 
人 跑 到 外 面 跑 吐 咕 咕 的 给 客户 印象 不 好 ， 如 果 两 个 人 一 起 出 去 抽 支 烟 ， 就 很 正常 了 。 细 想 一 下 也 
确实 有 道理 ， 所 以 后 来 我 每 次 出 去 做 项 目 ， 都 会 带 上 几 包 烟 。 有 时 候 觉得 累 了 ， 想 出 去 透 透气 或 
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者 打 几 个 电话 ， 我 都 会 以 吸烟 的 名 义 出 去 一 下 。 

老 于 给 我 介绍 了 一 下 上 午 会 议 的 情况 。 小 齐 和 老 方 上 午 也 参加 了 会 议 , 不 过 会 议 一 结束 他 们 
就 急忙 赶 回 北京 向 北方 公司 的 领导 汇报 项 目 情况 去 了 。 上 午 的 会 很 简单 , 会议 由 客户 方 的 孙 主 任 
主持 ， 小 齐 代 表 公 司 做 了 优化 项 目的 安排 。 主 要 是 介绍 我 们 的 两 个 文档 《XX 项 目 优化 工作 进度 
安排 》 和 《XX 项 目 分 工 界面 》。 小 齐 介 绍 完 后 , 客户 方 的 张 工 代 表 客 户 方 介绍 了 目标 系统 的 现状 。 
应 用 开发 商 的 代表 也 在 会 上 表态 , 一 定 会 认真 配合 优化 小 组 的 工作 。 不 过 由 于 开发 商 的 负责 人 范 
总 有 事 在 云南 出 差 ， 所 以 开发 商 仅 有 现场 支持 工程 师 参 会 ， 并 无 高 层 参 加 。 会 议 的 气氛 很 融洽 ， 
几 方 代表 都 表示 会 全 力 以 赴 来 做 这 个 项 目 。 最 后 老 于 特别 强调 , 虽然 他 是 这 个 项 目的 现场 负责 
但 他 感觉 在 优化 项 目 方面 ， 我 的 经 验 更 丰富 一 些 ， 所 以 在 关键 问题 的 决策 上 ， 希 望 我 多 拿 注意 。 

Witze. 我 们 就 来 到 了 办 公 室 。 这 里 是 客户 的 机 房 , 我 们 就 在 机 房 旁 边 的 一 间 办 公 室 里 办 
A. 除了 我 们 之 外 ， 只 有 开发 商 的 一 位 做 应 用 维护 的 工程 师 在 这 里 。 客 户 一 般 在 浑 南 办 公 ， 只 有 
每 个 月 做 账 务 处 理 时 才 会 到 这 里 来 办 公 。 这 种 工作 环境 是 我 所 喜欢 的 , 不 用 在 甲 方 的 眼皮 底下 干 
活 ， 也 就 很 少 会 被 甲 方 干扰 。 曾 经 有 一 次 做 一 个 优化 项 目 时 ， 和 客户 的 运 维 部 门 的 办 公 桌 相 邻 在 
白天 上 班 的 时 间 ， 我 基本 上 成 了 客户 的 DBA， 不 停 地 帮 着 甲 方 做 一 些 琐 碎 的 事情 。 

老 于 和 老 肖 简 单 地 给 我 介绍 了 一 下 情况 后 ， 我 们 就 一 起 离开 了 办 公 室 。 半 个 小 时 后 ， 我 们 3 
个 人 在 故宫 边 上 的 一 个 小 酒馆 里 喝 了 顿 小 酒 。 老 于 是 东北 人 ， 很 豪爽 ,酒量 也 不 错 ， 老 省 一口 纯 
正 的 北京 话 ， 但 是 酒量 还 不 如 我 ， 这 种 酒 老 于 肯定 喝 不 痛快 。 我 喝酒 不 行 ， 不 过 抽烟 到 还 可 以 ， 
虽然 戒烟 已 经 儿 年 了 ,但 因 和 朋友 在 一 起 ， 抽 上 几 根 烟 ， 还 是 很 快活 的 。 

老 于 感觉 这 个 项 目 很 坏 手 ， 系 统 资源 严重 不 足 ， 应 用 开销 很 大 , 但 客户 不 希望 通过 扩容 来 解 
决 问题 ， 而 希望 通过 调 优 解决 所 有 的 问题 。 在 前 期 的 接触 中 发 现 应 用 开发 厂商 很 难 配合 ， 这 可 能 
成 为 阻 得 项 目 成 功 最 重大 的 隐患 。 老 于 说 ， 和 希望 我 和 老 能 加 入 是 他 看 了 这 个 系统 后 做 出 的 决定 ， 
因为 他 和 老 肖 都 觉得 这 个 项 目 难 度 很 大 , 而 他 们 两 个 人 对 电信 的 业务 不 熟悉 , 做 应 用 优化 的 把 握 
不 大 。 沈阳 这 个 项 目 是 试点 项 目 , 北方 公司 选择 了 我 们 公司 和 一 家 做 系统 集成 的 公司 分 别 在 辽宁 
和 山西 做 优化 项 目 ， 所 以 这 个 项 目的 成 败 又 决定 了 北方 九 省 这 个 大 项 目 花 落 谁 家 。 按照 老 方 的 话 
说 ， 这 个 项 目 只 能 成 功 ， 不 能 失败 。 

从 给 客户 的 承诺 来 看 ， 系 统 总 体 性 能 要 提升 30%。 要 从 数字 上 完成 这 个 目标 ， 不 是 不 可 能 ， 
但 是 单纯 的 数字 并 不 能 解决 问题 , 客户 的 需求 是 解决 目前 3 套 系 统 存在 的 性 能 瓶颈 和 资源 不 足 的 
问题 ， 减 少 投诉 ， 而 不 是 玩 数字 游戏 ， 系 统 总 体 性 能 提升 30% 并 不 能 彻底 解决 目前 用 户 面临 的 主 
要 问题 。 这 个 项 目 不 仅 要 做 到 从 数字 上 提升 性 能 ， 更 要 彻底 解决 目前 存在 的 问题 ， 并 且 保证 在 大 
集中 之 前 能 够 保持 稳定 运行 。 从 目前 老 于 和 老 肖 掌握 的 情况 分 析 ， 除 了 大 规模 地 优化 SQL 外 ， 
还 没有 看 到 任何 其 他 的 成 功 途 径 。 

我 和 老 于 是 风格 不 同 的 两 种 人 ， 对 于 项 目 ， 我 向 来 是 乐观 的 。 我 虽然 很 少 做 出 承诺 ， 但 是 在 
内 心里 对 任何 一 个 项 目 都 保持 乐观 。 只 要 是 系统 ， 肯 定 有 问题 ， 有 问题 我 肯定 能 找到 一 一 这 是 我 
的 信条 。 碰 到 这 种 项 目 ， 我 反而 感到 有 些 兴 奋 ， 好 久 没有 机 会 大 干 一 场 了 。 我 和 老 于 说 ,我 想 办 
法 肯定 会 有 的 ， 这 个 项 目 动用 了 这 么 强 的 力量 ， 不 可 能 没有 效果 的 。 两 瓶 啤酒 下 去 后 ， 我 就 面 红 
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耳 赤 ,心跳 加 速 了 。 我 和 老 于 说 ， 不 能 喝 了 ， 来 点 饺子 就 回去 吧 。 老 于 酒 喝 得 正高 兴 ， 谈 兴 也 正 
浓 ， 不 过 看 到 我 和 老 肖 喝酒 的 这 种 状态 ， 也 只 好 草草 收兵 了 。 
回 到 酒店 后 ,我 洗 了 个 澡 , 翻 看 了 一 遍 老 于 刚才 找 给 我 的 资料 ,发 现 系 统 中 最 大 的 问题 是 
源 不 足 , 一 台 有 两 个 CPU 的 P650 居然 承担 全 省 销 账 系统 的 业务 ， 真 让 人 难以 置信 ， 要 在 这 样 的 
系统 中 进行 优化 确实 难度 很 大 。 不 管 怎么 样 ， 一 切 都 明天 再 说 吧 。5 个 多 小 时 的 航程 ， 已 经 让 我 
废 备 不 堪 了 ， 现 在 最 需要 的 是 良好 的 睡眠 。 


oF sane 日 点 评 


老 白 〈 老 白 ”是 本 书 作者 的 代称 。 使 用 第 三 人 称 可 以 排除 一 些 主观 的 因素 ， 也 便于 读者 理 
解 ) 从 今天 开始 要 去 做 一 个 优化 项 目 ， 希望 这 次 老 白 的 性 能 优化 之 旅 能 够 给 大 家 带 来 一 些 启示 。 
今天 老 白 在 飞机 上 阅读 了 老 于 发 来 的 关于 项 目的 资料 。 项 目 没 有 开始 , 怎么 会 有 资料 呢 ? 一 般 情 
况 下 , 优化 项 目 往 往 在 售 前 阶段 就 会 对 用 户 的 系统 进行 一 个 初步 的 诊断 , 定位 客户 的 系统 有 什么 
方面 的 问题 ， 以 便于 制订 优化 目标 ， 因 为 在 和 客户 签 定 的 合同 里 ， 肯 定 要 有 优化 目标 。 为 了 作出 
合理 的 承诺 ， 必 须 在 售 前 阶段 采集 部 分 系统 的 数据 ， 再 由 专家 对 这 些 数据 进行 分 析 和 评估 ， 从 而 
得 到 一 个 合理 的 目标 ， 并 明确 地 签署 在 合同 中 。 而 这 个 优化 目标 将 来 也 会 成 为 验收 的 重要 标准 。 
在 今天 ， 我 们 还 接触 到 一 个 概念 就 是 开工 会 ， 老 外 一 般 称 为 kickoff meeting。 开 工会 是 优化 
项 目 中 很 重要 的 一 个 会 议 。 做 优化 项 目 ， 决 不 能 “悄悄 地 进 村 ， 打 枪 的 不 要 ”"， 而 是 要 大 张 旗 鼓 
地 进行 。 在 初次 入 场 时 ， 一 定 要 把 客户 管理 这 个 项 目的 负责 人 、 接 口 人 等 召集 到 一 起 ， 讨 论 优化 
计划 、 接 口 规则 等 ， 同 时 告知 客户 所 有 需要 他 们 提供 的 东西 ， 还 要 告知 客户 其 中 的 一 些 风 险 。 

比如 在 沈阳 这 个 项 目的 开工 会 上 ， 我 们 准备 了 《XX 项 目 优化 工作 进度 安排 》、《XX 项 目 分 
工 界面 》 这 两 个 文档 。 客 户 向 我 们 提交 了 《系统 优化 项 目 初步 安排 》、《XX 系统 设备 及 服务 现状 》 
等 资料 。 我 们 向 客户 申请 了 所 涉及 服务 器 的 Unix 操作 系统 账号 以 及 Oracle 权限 账号 , 还 有 VPN 
临时 账号 等 在 本 次 优化 项 目 中 需要 的 权限 。 为 了 方便 进出 机 房 ， 我 们 还 向 客户 申请 了 门禁 。 

从 今天 的 日 记 里 ,我 们 还 应 该 注意 到 一 个 问题 ,就 是 为 什么 这 个 项 目 需 要 老 白 和 老 能 的 加 盟 
这 涉及 一 个 资源 调配 的 问题 。 需要 根据 售 前 对 项 目的 分 析 做 出 正确 的 判断 , 这 个 项 目 中 需要 什么 
样 的 技术 人 员 。 如 果 人 员 安排 不 合理 ， 那么 在 实施 过 程 中 将 会 遇 到 很 多 麻烦 。 


置信 优化 小 技巧 ) 性 能 优化 项 目 


Oracle 数据 库 优化 是 Oracle 管理 工作 中 最 重要 和 最 复杂 的 工作 之 一 。 数据库 优化 也 是 数据 库 
维护 的 日 常 工 作 之 一 。 数 据 库 不 是 孤立 的 ， 而 是 和 一 些 应 用 具有 紧密 关系 ,数据 库 往 往 是 应 用 系 
统 中 最 关键 的 部 分 ， 因 此 数据 库 优化 不 能 完全 脱离 应 用 而 进行 。 实 践 证 明 ， 数 据 库 管 理 维护 人 员 
与 应 用 开发 者 的 合作 越 好 ， 数 据 库 优化 就 越 容易 成 功 。 

另外 , 数据 库 优化 是 从 应 用 系统 开始 规划 到 应 用 系统 退役 整个 过 程 中 都 在 不 断 进行 的 , 因此 ， 
数据 库 优化 是 一 个 长 期 的 工作 。 很 多 用 户 希 望 通过 一 次 优化 就 达到 一 劳 永 逸 的 效果 ,而 没有 树立 
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数据 库 优化 工作 长 期 持久 的 观念 , 这 样 往往 会 导致 数据 库 在 长 期 的 系统 运行 过 程 中 没有 得 到 必要 
的 维护 ， 以 至 于 一 旦 发 生 问题 ， 造 成 很 大 的 损失 。 

数据 库 优化 可 以 从 多 个 层次 进行 : 系统 级 、 应 用 级 、 硬 件 资 源 级 等 。 数 据 库 优 化 的 目的 是 使 
数据 库 的 性 能 满足 应 用 系统 的 需要 ， 因 此 在 数据 库 优化 时 需要 制订 一 个 优化 目标 , 经 过 优化 后 能 
够 达到 预期 的 目标 ,优化 工作 就 可 以 停止 。 优 化 的 效果 和 优化 的 成 本 是 有 一 定 关系 的 , 根据 成 本 
选 定 优化 效果 是 制订 优化 目标 的 关键 。 任 何 超出 最 大 投入 成 本 的 优化 都 是 很 难 实现 的 。 

数据 库 优化 也 是 一 个 相对 的 工作 ， 大 家 都 知道 ， 系 统 越 大 ， 数 据 库 维护 的 难度 也 越 大 。 那 么 
什么 是 大 系统 呢 ? 仅仅 从 数据 量 来 划分 大 小 系统 已 经 过 时 了 。 如 果 有 一 个 系统 ,其 并 发 量 和 对 数 
据 库 服务 器 的 负载 无 法 对 数据 库 服务 器 (比如 说 是 一 台 性 能 十 分 好 的 小 型 机 ) 本 身 造 成 很 大 的 负 
担 ， 那 么 这 个 系统 的 优化 工作 将 十 分 简单 。 而 对 于 相同 的 系统 ， 如 果 使 用 一 台 只 有 一 个 CPU 的 
微机 服务 器 作为 数据 库 服务 器 ,那么 这 个 系统 的 负载 将 很 大 ,对 于 这 个 系统 的 维护 将 是 十 分 困难 
的 。 因 此 ,大 系统 和 小 系统 不 仅仅 要 看 它 的 数据 量 ， 还 要 看 系统 的 负载 与 服务 器 的 综合 处 理 能 力 
的 对 比 。 平 常 负载 已 经 达到 服务 器 最 大 负载 80% 以 上 的 系统 ， 可 以 说 是 高 负载 系统 ， 这 种 系统 
的 维护 难度 也 是 比较 大 的 。 

数据 库 优化 工作 应 该 成 为 DBA 日 常 工作 的 一 部 分 ， 而 不 应 该 到 了 系统 出 现 严 重 问题 后 才 进 
ÍT. 如 果 日 常 优化 工作 做 得 好 , 就 不 需要 经 常 进行 大 型 的 系统 优化 , 系统 运行 状态 也 会 比较 正常 ， 
总 体 维护 开销 会 大 幅度 下 降 。 

沈阳 的 客户 数据 库 的 数据 量 并 不 大 ,也 就 是 几 百 吉 字 节 , 但 由 于 服务 器 普遍 比较 老 , 配置 比 
较 低 ， 所 以 系统 的 压力 还 是 十 分 大 的 。 在 这 里 讲 到 的 STATSPACK 报告 ， 是 做 数据 库 性 能 分 析 中 
经 常 使 用 的 工具 。 在 Oracle 10g 及 以 后 的 版 本 中 ， 可 以 使 用 AWR 报告 和 ASH 报告 来 替代 
STATSPACK 报告 。AWR 和 ASH 报告 可 以 提供 比 STATSPACK 报告 更 为 详细 的 信息 。 
(STATSPACK 报告 的 默认 采样 级 别 为 5S， 如 果 做 6 级 或 者 更 高 的 STATSPACK 采样 ， 会 获得 更 为 
详细 的 信息 ,不 过 采集 快照 时 的 开销 更 大 。 一 般 来 说 ， 对 于 资源 比较 紧张 的 系统 ， 不 建议 做 7 级 
或 者 更 高 的 快照 。) 

从 我 多 年 的 数据 库 优 化 工作 的 经 验 来 看 , 数据 库 优化 实际 上 是 在 一 定 资源 下 , 对 资源 的 使 用 
方式 进行 重组 ， 以 达到 用 户 的 目标 。 数 据 库 优化 往往 要 在 响应 时 间 和 系统 吞吐 量 之 间 进 行 权衡 。 
提高 响应 时 间 可 能 需要 增加 系统 的 吞吐 量 ， 从 而 加 重 系统 的 整体 负担 。 优 化 系统 的 吞吐 量 可 能 会 
降低 系统 的 整体 负担 ， 但 是 可 能 会 加 大 平均 响应 时 间 。 

从 总 体 来 说 ， 数 据 库 优 化 可 以 有 3 条 途径 : 

a 调整 应 用 系统 ， 缩 短 某 个 事务 的 响应 时 间 ， 
a 更 加 均匀 地 分 配 任务 ， 使 系统 负载 降低 ， 
O 调整 系统 资源 的 配置 。 

系统 资源 是 有 限 的 , 每 个 计算 机 系统 都 有 自己 最 大 的 负载 能 力 , 如 果 当 前 整体 负载 超出 计算 
机 的 最 大 负荷 能 力 ， 这 时 系统 就 处 于 过 载 状态 。 系 统 的 任何 一 个 资源 一 旦 过 载 ， 数 据 库 性 能 就 会 
急剧 下 降 。 因 此 在 进行 数据 库 优 化 时 ， 要 尽量 避免 系统 的 任何 资源 出 现 过 载 ， 可 以 通过 资源 配置 
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来 提高 另 一 种 资源 的 使 用 ， 以 降低 高 负载 资源 的 使 用 。 但 是 如 果 系 统 资源 过 载 严重 ， 通 过 调整 资 
源 配 置 可 能 也 无 法 达到 优化 目的 , 此 时 增加 系统 资源 将 不 可 避免 , 这 种 情况 也 就 是 我 们 常 说 的 系 
统 升 级 。 


micas) 优化 常用 知识 1; 诊断 事件 


要 想 做 好 数据 库 的 性 能 优化 ， 必 须 进 一 步 了 解 Oracle 的 内 部 结构 和 一 些 基本 原理 。Oracle 
诊断 事件 就 是 这 样 的 一 种 知识 , 它 在 日 常 Oracle 数据 库 维护 、 性 能 优化 、 故障 处 理 中 经 常会 用 到 。 
Oracle 诊断 事件 是 Oracle DBA 的 一 项 基本 技能 ， 必 须 认 真 掌 握 。 从 今天 开始 ， 老 白 将 用 几 天 时 
间 ， 向 大 家 简单 介绍 一 下 Oracle 诊断 事件 。 这 些 内 容 在 一 些 Oracle 技术 书 上 也 有 介绍 ，Oracle 
也 有 一 门 课程 叫做 《Oracle 诊断 事件 》。 如 果 读 者 阅读 过 类 似 的 图 书 , 或 者 已 经 基本 掌握 了 Oracle 
诊断 事件 的 基础 知识 , 可 以 跳 过 本 节 。 对 于 刚刚 学 习 Oracle 的 初学 者 , 本 节 的 内 容 可 能 过 于 深奥 ， 
你 也 完全 可 以 跳 过 本 节 ， 看 完 本 书后 ， 再 回头 来 阅读 。 

首先 我 们 引用 一 下 《Oracle 诊断 事件 》 培 训 课程 第 一 页 的 内 容 。 




















Disclaimer 
This seminar covers several undocumented 


and unsupported techniques 

Some of these techniques render a database 
into an unsupported state 

Never use these techniques without first 
contacting customer support 











这 张 PPT 是 一 个 红色 警告 ， 明 确 告诉 每 个 学 习 Oracle 诊断 事件 的 人 ，Oracle 诊断 事件 只 是 
一 些 非 官方 文档 中 介绍 的 非常 规 知识 , 并 且 Oracle 不 会 对 诊断 事件 提供 技术 支持 。 很 多 诊断 事件 
的 设置 可 能 导致 数据 库 出 现 不 可 恢复 的 故障 ， 甚 至 导致 Oracle 无 法 为 你 的 数据 库 提 供 技术 支持 ， 
因此 Oracle 诊断 事件 在 生产 库 上 应 该 慎 用 。 
一 般 来 说 , 使 用 Oracle 诊断 事件 的 场合 有 几 种 , 其 中 最 常见 的 是 : 当 数据 库 出 现 了 某 种 故障 ， 
要 通过 设置 诊断 事件 来 对 数据 库 进行 更 深入 的 分 析 ; 其 次 是 通过 激活 Oracle 的 隐 含 特性 或 者 改变 
Oracle 数据 库 的 运行 特性 来 临时 解决 某 些 问题 ， 包 括 性 能 问题 。 由 于 某 个 诊断 事件 在 不 同 的 数据 
库 版 本 上 的 特性 是 不 同 的 , 因此 在 设置 某 个 事件 时 , 一 定 要 明确 这 个 事件 在 你 当前 使 用 的 版 本 上 
的 特性 ， 而 不 能 通过 其 他 版 本 来 进行 对 等 的 推测 ， 否 则 可 能 会 导致 严重 的 后 果 。 在 使 用 Oracle 
诊断 事件 之 前 , 最 好 找 专家 或 者 Oracle 公司 进行 咨询 , 并 且 在 实施 风险 较 大 的 操作 前 做 好 数据 库 
的 备份 。 
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Oracle 诊断 事件 的 使 用 范畴 大 致 可 以 分 为 4 类 。 
a 在 需要 的 时 候 转 储 诊断 信息 (immediate dump) ， 主 要 对 文件 头 、 系 统 、 进 程 等 信息 进行 
转 储 。 
O 在 发 生 某 种 错误 的 时 候 转 储 诊 断 信 息 (On-Error dump), 
a 修改 数据 库 的 运行 特性 。 
a 数据 库 运 行 时 产生 相关 日 志 。 
每 一 个 事件 都 有 一 个 事件 号 ， 事 件 号 跟 Oracle 的 错误 信息 的 编码 是 一 样 的 ， 如 10046 和 
ORA-10046。 每 一 个 事件 都 有 一 个 级 别 ， 可 以 是 以 下 几 种 形式 。 
a 范围 : 1 到 10。 
a 位 标 : 0x01 、0x02、 0x04 、0x08 、0x10。 
QO 标识 : O=off, 1=on, 
a D4: 对 象 ID ， 内 存 地 址 。 
事件 可 以 通过 ALTER SESSION|SYSTEM 命令 来 激活 和 去 除 激 活 ， 语 法 如 下 : 


<event name> <action> {:<event name> <action>}* 
<action>::= "trace" <action qualifier> 
{,<action qualifier>}* 
<action qualifier>::= <trace spec> 
{;<trace spec>}* 
<trace spec>::= "name" <trace name> 
<trace qualifier> 
{,<trace qualifier>}* 
«trace qualifier>::= ""|"off"| 
"after «n» times"| 
"forever" | 
"lifetime <n>"| 
"level <n>" 


事件 可 以 在 参数 文件 中 设置 ， 也 可 以 在 实例 级 或 者 会 话 级 设置 。 可 以 通过 ALTER 





























SYSTEM| SESSION 命令 直接 设置 ， 也 可 以 通过 oradebug 或 者 sys .dbms_system.set_ev(…) 
存储 过 程 进行 设置 。 
参数 文件 
event = "<event name> <action> 
{:<event name> <action>}*" 
当前 会 话 





ALTER SESSION SET EVENTS 
'«event name» «action» 
{:<event name» <action>}*' 
所 有 的 新 会 话 : 
ALTER SYSTEM SET EVENTS 
'«event name» «action» 
(:«event name» «action»)*' 
其 他 会 话 : 
sys.dbms_system.set_ev 
(sid,serial#,<event>,<level>, '<action>') 
In another session from a debug tool: 
oradebug «command» 
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今天 上 午 和 客户 在 邮政 大 厦 的 主机 房 磁 了 个 面 。 都 是 东北 人 , 所 以 大 家 也 设 多 讲 什 么 客 套话 ， 
上 来 就 直入 主题 。 张 工 他 们 一 来 , 就 让 我 看 了 一 下 他 们 的 内 部 BBS, 里面 充 满 了 对 这 个 系统 的 抱 
怨 与 期 望 。 我 以 前 做 海尔 优化 项 目 时 碰 到 过 类 似 的 情况 ， 那 时 候 海 尔 全 国 的 操作 人 员 组 成 了 多 个 
QQ 群 ， 在 里 面 发 汇 自 己 的 不 满 ， 老 万 每 天 都 在 群 里 找 出 儿 句 最 恶毒 的 话 来 刺激 我 的 神经 ， 希 望 
我 能 够 更 快 完成 项 目 。 我 现在 虽然 对 此 有 所 准备 ， 但 还 是 被 那些 BBS 上 的 留言 深 深 打动 了 。 由 
于 这 个 系统 的 问题 ,甚至 出 现 了 愤怒 的 客户 把 营业 台 的 玻璃 砸 碎 , 冲 进 员工 区 殴打 营业 员 的 恶性 
事件 。 

Asc BBS Ja, 张 工 说 这 回 全 靠 你 们 了 , 为 了 拿 到 优化 这 个 项 目的 试点 , 他 们 领导 差点 和 兄弟 
省 的 IT 部 门 打 起 来 。 被 圈定 为 优化 试点 后 ， 他 们 又 选择 我 们 来 做 实施 ， 没 有 选择 那 家 著名 的 集 
成 商 。 如 果 这 次 无 法 获得 满意 的 结果 ， 那 么 他 们 部 门 的 压力 将 会 很 大 ， 其 至 领导 的 位 子 都 会 出 现 
问题 。 

我 终于 能 够 理解 昨天 老 于 的 心情 了 ,这样 一 个 项 目 , 参与 者 的 压力 和 责任 是 可 想 而 知 的 。 运 
维 部 门面 对 这 样 的 系统 , 承受 了 相当 大 的 压力 , 他 们 也 希望 通过 这 一 次 优化 , 能 够 打 一 个 翻身 仗 。 
当 这 种 压力 传 到 老 于 身上 时 ， 作 为 项 目 经 理 ， 他 的 忧虑 是 十 分 正常 的 。 从 这 上 面 我 也 感受 到 一 点 
安慰 ,以 我 的 经 验 来 看 ， 这 样 的 客户 肯定 会 全 力 配 合 我 们 的 工作 ， 在 和 甲 方 的 关系 上 ,不 需要 我 
们 花 太 多 的 精力 。 

经 常 有 朋友 问 我 ,数据 库 优 化 应 该 怎么 做 。 实 际 上 ， 数据库 优化 并 不 是 什么 高 深 的 学 问 ， 和 
通常 解决 问题 是 一 个 思路 ， 都 要 经 历 了 解 情况 、 提 出 方案 、 实 施 方案 、 评 估 结 果 这 几 个 步骤 。 因 
此 ， 了 解 系统 的 情况 以 便于 下 一 步 根据 系统 实际 情况 提出 合理 的 优化 方案 是 十 分 重要 的 。 因 此 我 
做 系统 优化 的 方法 一 般 是 先 从 摸 清 系统 整体 情况 开始 , 包括 系统 现状 、 存 在 的 主要 问题 以 及 应 用 
系统 的 特点 等 。 如 果 可 能 ， 还 要 尽 可 能 地 了 解 清楚 硬件 配置 、 存 储 和 应 用 软件 的 体系 架构 等 。 

我 们 面 对 的 目标 系统 是 计 费 、 账 务 、 综 合 客服 三 大 系统 。 今 天 上 午 初 步 看 了 一 下 三 套 系统 的 
基本 情况 。 综 合 客服 系统 ， 主 机 配置 4 颗 CPU, CPU 资源 在 业务 进行 期 间 ， 基 本 可 以 满足 业务 
需要 ， 不 过 时 有 使 用 率 增 大 的 现象 ， 业 务 高 峰 期 间 经 常 达 到 100%。 在 平衡 运行 期 间 ，CPU 平均 
空间 为 70%， 繁 忙 时 段 空 闪 为 5% 左右， 系统 响应 速度 慢 ， 应 用 等 待 时 间 长 。 系 统 共 配 置 8GB 内 
存 ， 只 分 配给 了 Oracle 数据 库 2GB 左右 ， 但 是 空闲 内 存 只 有 150MB， 其 至 部 分 时 段 只 有 不 到 
100MB 空闲 内 存 。 存 储 全 部 采用 RAID 5 技术 划分 ， 读 出 效率 高 ， 可 是 写 入 效率 不 高 ， 对 于 频繁 
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需要 写 入 的 日 志文 件 和 控制 文件 的 操作 就 存在 着 瓶颈 。 业 务 高 峰 期 事务 平均 响应 时 间 为 100ms 
左右 。 

计 费 系统 ， 主 机 配置 6 颗 CPU, CPU 资源 在 业务 进行 期 间 基 本 可 以 满足 业务 需要 ， 时 有 使 
用 率 增 大 的 现象 。 在 平衡 运行 期 间 ， 平 均 空 闪 为 70%， 繁 忙 时 段 空 闪 为 15% 左 右 。 系 统 共 配 置 
12GB 内 存 ， 其 中 只 分 配给 了 Oracle 数据 库 2GB 左右 ， 实 内 存 剩余 9GB 以 上 。 但 是 空间 内 存 只 
有 500MB 甚至 更 少 ， 时 和 常 出 现 内 存 换 进 换 出 的 现象 。 存 储 也 是 采用 RAID 5, VOERDE, 
务 高 峰 期 间 VO 等 待 (WIO) 高 达 50%。 业 务 高 峰 期 事务 平均 响应 时 间 高 达 27 000ms。 

账 务 系统 ， 主 机 配置 2 颗 CPU, 在 平衡 运行 期 间 平 均 空间 为 65%， 繁忙 时 段 空间 为 0， 业务 
高 峰 期 间 ，CPU 的 运行 等 待 队 列 高 达 100 以 上 ， 甚 至 超过 200， 系 统 响 应 缓慢 ，CPU 存在 严重 的 
性 能 瓶颈 。 系 统 共 配置 8GB 内 存 ， 只 分 配给 了 Oracle 数据 库 2GB 左右 ， 在 业务 繁忙 期 间 剩余 的 
KAFRA 100MB 其 至 更 少 ， 业 务 期 间 出 现 频 繁 的 换 进 换 出 现象 ， 内 存 严 重 不 足 。 业 务 高 峰 期 
lal, O 等待 (WIO) f£ 30%~40%, M STATSPACK 报告 上 看 ， 系 统 VO 性 能 不 佳 。 业 务 高 峰 期 
系统 事务 平均 响应 时 间 高 达 3 800ms, 

面 对 这 样 三 套 系统 , 我 觉得 优化 的 难度 还 是 比较 大 的 。 在 以 往 参加 的 优化 项 目 中 , 锦上添花 
的 比较 多 ， 系统 虽 然 存 在 一 些 性 能 问题 , 但 是 对 生产 的 影响 还 不 是 十 分 大 ， 所 以 优化 的 目标 也 比 
较 容 易 达 成 。 而 这 种 已 经 基本 上 算是 病人 襄 育 、 资 源 严重 不 足 的 系统 ， 还 是 比较 少见 。 襄 且 客 户 
的 期 望 不 仅仅 是 说 要 从 技术 指标 上 提升 多 少 倍 ， 还 要 通过 这 次 优化 ， 彻 底 解决 他 们 在 IT 运 维 中 
无 法 解决 的 难题 ， 使 运 维 人 员 不 要 每 天 疫 于 应 付 来 自 四 面 八方 的 投诉 。 

中 午 和 张 工 他 们 在 旁边 的 一 家 小 餐馆 里 一 起 吃 了 顿 便 饭 。 张 工 的 年 龄 和 我 们 相仿 , 以 前 是 乙 
方 的 ， 到 甲 方 来 时 间 还 不 长 ， 不 过 一 来 就 遇 到 这 么 个 烂摊子 ， 也 真是 难为 他 了 。 我 说 要 不 要 喝 点 
酒 ， 张 工 立马 制止 了 :“ 中 午 就 算 了 吧 ， 回 去 被 领导 看 见 不 好 。 我 也 很 想 和 你 们 好 好 喝 一 顿 ， 不 
过 希望 是 在 优化 完成 时 。 听 说 老 于 酒量 不 错 ， 到 时 候 我 们 喝 个 痛快 。 

下 午 账 务 系统 和 业务 支撑 系统 又 出 现 了 大 规模 的 投诉 , 集成 商 负责 现场 维护 的 小 孙 跑 出 来 找 
我 们 时 ， 我 和 老 于 、 老 肖 正 在 吸烟 区 吞 云 吐 雾 地 讨论 下 一 步 如 何 安排 。 老 肖 不 抽烟 ， 被 夹 在 两 根 
烟 枪 中 间 ， 却 也 没 显 得 不 适应 ， 估 计 他 是 被 老 于 这 杆 烟 枪 票 陶 习惯 了 。 我 问 小 孙 怎 么 回 事 ， 小 孙 
说 大 量 营 业 厅 在 投诉 ， 说 慢 得 无 法 操作 ， 他 自己 也 试 了 一 下 ， 登 录 系 统 就 要 一 分 多 钟 。 

我 和 老 于 急忙 招 了 烟 ， 跑 进 机 房 。 到 现场 一 看 ， 收 费 系统 的 CPU 等 待 队列 高 达 200， 随 便 
一 个 ps 命令 都 要 两 三 秒 才 有 反应 ， 看 样子 系统 资源 是 遇 到 严重 的 瓶颈 了 。 这 几 天 是 收费 的 高 峰 
期 ， 现 金 收 费 一 般 是 从 每 个 月 10 日 开始 的 ， 托 收 账户 的 扣 费 也 要 在 11 日 和 12 日 这 两 天 完成 。 
我 首先 查看 v$session wait 里 的 等 待 事件 , 老 于 直接 启动 了 topas, 查看 哪些 进程 在 消耗 CPU 
资源 。 在 vssession wait $, 我 看 到 了 大 量 的 db file sequential read, db file scatter read 和 cache 
buffer chains 门 锁 的 等 待 。 从 这 种 情况 来 看 ， 肯 定 是 存在 某 个 应 用 大 量 访问 某 些 表 ， 导 致 消耗 了 
大 量 CPU 资源 。 老 于 从 topas 上 也 看 到 了 10 多 个 消耗 CPU 资源 十 分 严重 的 进程 。 老 于 立即 通 
过 v$process fll v$session 找到 了 这 些 进程 正在 执行 的 SQL, 我 也 通过 OEM 的 Top SQL 工具 
定位 了 这 些 SQL， 和 老 于 找到 的 是 一 致 的 。 情 况 很 明确 了 ， 有 一 个 SQL 占用 了 过 多 的 系统 资源 ， 
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从 而 导致 系统 CPU 资源 被 耗 尽 ， 导 致 cache buffer chains 门 锁 出 现 问 题 。 这 个 SQL 来 源 于 10 多 
个 不 同 的 会 话 ， 看 样子 是 一 个 什么 程序 模块 导致 的 ， 而 不 是 由 于 某 个 人 的 个 人 操作 ， 因 此 我 们 把 
SQL 告诉 小 孙 ， 让 他 联系 开发 人 员 ， 确 认 这 个 SQL 究竟 属于 哪个 应 用 模块 。 小 孙 通 过 电话 询问 
了 开发 人 员 , 很 快 就 找到 了 原因 , 这 个 SQL 属于 一 个 批量 打印 发 票 的 程序 。 我们 几 个 把 这 个 SQL 
分 析 了 一 下 , 它 开销 最 大 的 部 分 是 对 某 张 几 千 万 数据 的 大 表 通 过 索引 扫描 查找 数据 , 每 次 会 查 出 
几 万 条 数据 ， 然 后 通过 Hash 连接 的 方式 和 其 他 表 连 接 。 从 执行 计划 上 来 看 ， 也 没有 明显 不 合理 
的 地 方 ， 感 觉 短 时 间 内 还 没有 办 法 解决 这 个 问题 。 这 个 应 用 不 是 简单 地 加 个 索引 就 能 够 优化 的 ， 
里 面包 含 的 几 个 SQL 都 是 五 六 张 表 的 连接 ， 想 优化 确实 还 不 容易 。 

通过 和 营业 厅 沟 通 ， 了 解 到 批量 打发 票 一 般 是 在 每 个 月 10 日 以 后 开始 做 ,由 于 比较 耗资 源 ， 
所 以 这 个 应 用 一 般 都 是 晚上 跑 , 白天 是 不 允许 做 的 。 不 过 由 于 最 近 系 统 性 能 存在 问题 ,这 个 月 的 
出 账 晚 了 一 天 ， 所 以 这 个 程序 10 日 没有 跑 ，11 日 晚上 才 开 放 了 这 个 功能 。 为 了 赶 时 间 ， 个别 营 
业 厅 把 这 个 业务 放 到 白天 来 做 了 , 这 才 导 致 了 今天 下 午 出 现 了 系统 性 能 问题 。 老 于 马上 通知 了 张 
T, 希望 张 工 协调 一 下 这 些 营 业 厅 ,让 他 们 暂停 这 个 操作 。 通 过 张 工 和 这 儿 个 营业 厅 协 商 , 这 个 
应 用 暂停 ， 压 到 18 : 00 以 后 继续 运行 。 得 到 张 工 确认 后 ,我们 将 还 在 跑 的 10 多 个 会 话 杀 了 ， 系 
统 负 载 一 下 子 降 了 下 来 ， 从 vmstat 上 看 ， 运 行 队 列 一 下 子 降低 到 20 一 40， 看 样子 问题 解决 了 。 

问题 解决 后 ,， 张 工 打 了 个 电话 过 来 ， 老 于 正在 洗手 间 里 ， 所 以 我 替 他 接 了 这 个 电话 。 在 电话 
E, 张 工 针对 刚才 这 个 问题 感慨 了 半天 , 我 也 一 直 感 觉 张 工 绕 来 绕 去 的 ， 肯定 是 有 什么 话 想 说 又 
不 好 意思 说 。 我 就 问 他 是 不 是 有 什么 话 不 太 方 便 说 ,他 于 是 问 我 能 不 能 提前 做 点 什么 , 把 目前 我 
们 已 经 分 析 清 楚 可 以 做 的 优化 操作 提前 做 一 下 , 缓解 现在 的 紧张 局 面 。 我 说 目前 我 们 的 主要 任务 
还 是 分 析 问 题 ， 按 照 项 目 计 划 ， 我 们 的 第 一 次 实施 时 间 是 6 月 15 日 至 6 月 25 日 , 现在 做 点 什么 
可 能 会 起 到 一 定 的 作用 , 但 是 对 于 整个 优化 项 目 来 说 , 会 把 先前 的 计划 完全 打 乱 ， 甚 至 最 终 可 能 
会 影响 整个 项 目 ， 反 而 得 不 偿 失 。 张 工 略 感 失望 ,但 是 也 很 无 奈 ， 和 毕竟 一 年 都 挺 过 来 了 ， 也 就 不 
差 这 十 天 半 个 月 了 。 

本 来 下 午 想 和 开发 厂商 开 个 碰头 会 , 由 于 刚才 的 突 发 事件 ,一 直 拖 到 快 下 班 时 才 腾 出 时 间 来 。 
不 过 见面 的 结果 很 令 人 失望， 虽然 应 用 厂商 在 这 边 留 有 一 支 近 10 个 人 的 开发 队伍 ， 并 且 配 备 了 
一 名 项 目 经 理 ， 但 是 基本 上 帮 不 了 什么 忙 。 项 目 经 理 小 王 是 个 不 到 30 岁 的 年 轻 人 ， 挺 不 错 的 东 
北 小 伙 子 , 不 过 他 的 职权 有 限 , 一 切 行动 都 必须 听 范 总 的 。 而 且 这 个 开发 团队 的 主要 工作 是 解决 
小 版 本 升级 的 问题 ,最 近 手 头 的 工作 特别 忙 ， 主 要 精力 都 在 应 付 需 求 变 更 , 根本 没有 时 间 来 配合 
我 们 做 一 些 应 用 的 分 析 与 调整 。 为 了 这 个 项 目 , 开发 商 安排 了 一 个 配合 我 们 做 优化 的 工程 师 ， 这 
个 工程 师 就 是 平时 和 我 们 在 一 起 工作 的 小 孙 , 他 目前 的 主要 任务 是 负责 应 用 运 维 , 实际 上 充当 的 
是 一 个 服务 台 接 线 员 的 角色 ， 负 责 接 客服 热线 ， 然 后 把 问题 转发 给 现场 的 开发 团队 。 作 为 刚刚 毕 
业 不 到 一 年 的 新 手 , 小 孙 基 本 上 只 能 充当 一 个 现场 协调 的 角色 , 其 至 连 协调 这 种 工作 也 不 一 定 能 
够 很 好 地 完成 。 小 孙 和 我 所 希望 的 能 够 配合 我 们 进行 SQL 优化 的 人 员 相差 甚 远 ， 不 知道 是 开发 
商 故 意 这 么 安排 呢 , 还 是 他 们 没有 理解 我 们 的 实际 要 求 。 这 些 问 题 看 样子 必须 在 明天 的 四 方 协调 
工作 会 议 上 提出 ， 因 为 从 初步 的 分 析 来 看 ，SQL 调 优 将 是 项 目 成 败 的 关键 。 本 来 我 想 了 解 一 下 应 
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用 系统 的 架构 以 及 他 们 对 系统 瓶颈 的 认识 。 不 过 开发 商 那 边 以 最 近 任 务 比较 紧 并 且 现 场 工程 师 对 
这 些 


情况 不 太 了 解 为 由 拒绝 了 , 看 样子 应 用 软件 方面 的 问题 ， 


x, 一 切 都 要 靠 自 己 了 。 


oF sant 


今后 依赖 开发 商 来 提供 信 ， 


息 不 大 现 


今天 刚刚 进 场 ， 所 以 老 白 主 要 是 了 解 系统 的 状态 ， 这 需要 从 服务 器 、 操 作 系统 、 存 储 、 数 据 
库 等 多 个 层面 去 了 解 。 为 此 老 白 也 准备 了 一 个 检查 表 ， 内 容 如 下 。 


丛 查 项 目 


相关 文件 或 结果 状 5 备 


注 





Oracle Alert 日 志 
bdump/adump 下 是 否 存在 明显 的 报警 
listener 相 关 日 志 

SQL*Net 日 志 

参数 /参数 文件 


listener.ora/tnsnames.ora 


Fx ero 








操作 系统 版 本 
检查 操作 系统 补丁 


操作 系统 异步 WO 情况 
系统 交换 区 情况 
主机 物理 内 存 情况 

















CPU 使 用 情况 
网 络 情况 : 

网 卡 情况 
a 路 由 情况 
口 hosts 文 件 


n netstat[ El 





























temp 等 相关 目录 
内 核 参 数 和 ulimit 





文件 系统 情况 , 重点 检查 ORACLE_HOME、 归档 、 





数 | 数据库 版 本 ，SQL*Net 版 本 











配 大 小 ) 
E | 表 空 间 的 数量 








数据 库 大 小 (所 有 数据 文件 和 undo 表 空间 文件 的 
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相关 文件 或 结果 


状 








数据 文件 的 数量 
数据 文件 的 属性 
数据 文件 响应 性 能 
表 空 间 容量 


重 做 日 志 情 况 
重 做 日 志 组 数 
重 做 日 志文 件 大 小 
日 志 切 换 情况 
归档 情况 


控制 文件 情况 
回 滚 段 配置 














数据 库 负 载 与 主要 命中 率 指标 





DB Cache 分 析 
共享 池 分 析 
PGA 分 析 、 排 序 情况 分 析 








anced 








主要 等 待 事件 
门 锁 分 析 
锁 性 能 分 析 
undo 性 能 分 析 
RAC 性 能 分 析 





























FEE 


zm 
ow 


Top SQL 
Top 会 话 
应 用 的 节奏 
业务 并 发 量 























PAE 


备份 策略 
定期 Job 情 况 

停机 窗口 情况 
应 用 体系 架构 


























中 间 件 服务 器 情况 
(配置 、 容 量 、 架 构 等 ) 





实际 上 ， 对 于 不 同 的 系统 ， 这 个 检查 表 是 不 同 的 ， 其 目的 就 是 对 系统 进行 一 次 全 面 的 体检 ， 
以 便 了 解 系统 以 及 存在 的 问题 。 


今天 除了 了 解 系统 情况 外 ， 还 发 生 了 一 次 小 事故 。 由 于 某 个 业务 在 白天 





运行 ， 导 致 CPU ik 
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到 了 瓶颈 ， 最 后 决定 停 掉 这 部 分 应 用 ， 等 晚上 再 跑 ， 临 时 解决 了 问题 。 出 现 系统 性 能 问题 时 ， 可 
以 通过 Top 工具 找到 CPU 消耗 比较 大 的 进程 , 然后 通过 OEM 或 者 其 他 第 三 方 工具 对 这 些 进 程 进 
行 跟踪 ， 就 能 够 找到 这 些 进 程 在 做 什么 ， 从 而 找 出 故障 原因 。 当 然 使 用 脚本 vsprocess、 
v$session fil v$sqlarea 进行 分 析 也 能 达到 同样 的 目的 。 不 过 如 果 能 用 工具 ， 为 什么 不 用 呢 ? 
老 白 是 十 分 喜欢 使 用 工具 的 。 

今天 碰 到 的 性 能 问题 ， 老 白 他 们 暂时 无 法 解决 ， 最 后 是 通过 和 营业 厅 协 商 ， 让 他 们 暂停 了 革 
个 业务 模块 才 解 决 的 。 性 能 优化 过 程 中 碰 到 的 问题 并 不 一 定 必 须要 通过 技术 手段 来 解决 , 实际 上 
很 多 情况 下 可 以 通过 和 客户 协商 来 解决 问题 ,在 系统 出 现 了 严重 问题 而 暂时 又 没有 很 好 的 办 法 来 
解决 时 ， 暂停 一 些 可 以 暂停 的 业务 也 是 一 种 十 分 常用 的 解决 方法 ， 起码 来 说 , 停 掉 几 个 可 以 晚上 
跑 的 模块 总 比 系统 整个 不 能 用 要 好 得 多 。 这 一 点 ， 客 户 是 可 以 理解 的 。 

另外 , 今天 老 白 拒绝 了 张 工 要 求 提前 采取 优化 手段 的 要 求 , 这 一 点 体现 了 老 白 的 老 到 。 这 种 
大 型 优化 项 目 不 是 一 朝 一 夕 的 事情 ， 失 败 的 案例 也 比比 皆 是 。 这 种 项 目 必 须 按 部 就 班 地 进行 ， 早 
期 盲 动 是 十 分 不 明智 的 ， 必须 有 的 放 矢 才能 获得 好 的 效果 。 老 白 他 们 刚刚 进 场 ， 对 系统 根本 不 了 
解 ， 这 时 候 采 取 一 些 临 时 措施 可 能 效果 不 大 ， 甚 至 可 能 出 现 负面 的 效果 ， 所 以 在 这 种 情况 下 ， 老 
手 都 会 尽 可 能 避免 过 早 动 手 。 


E 2 优化 由 技巧 ) 数据 库 优化 的 步骤 


数据 库 优 化 是 一 个 系统 工程 ,需要 有 严密 的 组 织 和 严格 的 步 又。 这 里 介绍 一 种 最 常用 的 数据 
库 优化 步骤 。 一 个 完整 的 优化 过 程 应 该 包括 以 下 几 点 。 
O 明确 系统 现状 。 
制订 优化 目标 。 任 何 优 化 都 不 可 能 是 绝对 彻底 的 优化 ， 都 只 是 针对 目前 系统 状态 的 一 种 
资源 重组 。 优 化 的 目标 越 高 ， 优 化 的 难度 也 越 高 ， 甚 成 本 也 越 大 。 因 此 制订 合理 的 优化 
目标 是 十 分 重要 的 。 
采集 系统 并 分 析 数 据 。 根 据 优 化 目标 ， 对 数据 库 进行 数据 采集 ， 并 对 系统 进行 全 面 的 分 
析 ， 找 到 系统 中 的 性 能 瓶颈 。 
制订 优化 计划 。 根 据 采集 的 数据 和 分 析 结 果 ， 制 订 优 化 方案 和 实施 计划 。 
审核 优化 计划 。 和 客户 一 起 审核 优化 计划 ， 在 必要 的 情况 下 还 需要 和 应 用 开发 商 一 起 进 
行 优化 计划 的 审核 ， 确 保 优 化 计划 是 切实 可 行 的 。 
实施 优化 计划 。 
监测 优化 系统 。 数 据 库 优 化 是 整体 的 优化 ， 对 于 某 些 应 用 ， 优 化 后 可 能 会 有 反 效 果 。 因 
此 优化 完成 后 ， 需 要 对 所 有 的 应 用 系统 进行 监测 ， 如 果 有 某 些 应 用 受到 比较 大 的 负面 影 
响 ， 应 该 尽快 解决 这 些 问 题 。 
评估 优化 效果 。 优 化 完成 后 ， 对 优化 的 效果 进行 一 次 评估 。 
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这 个 优化 过 程 不 是 一 次 完成 的 , 如 果 评 估 优 化 效果 时 发 现 没 有 达到 预期 的 目的 , 这 个 过 程 还 


需要 从 头 再 来 一 次 ， 直 到 达到 优化 目标 为 止 。 








什么 是 目前 系统 中 最 大 的 问题 ， 比 如 : 

a 系统 服务 器 的 型 号 ，; 

Qa CPU 的 速度 及 数量 ， 

a 内 存 大 小 ， 

a IO 设备 情况 ; 

a 网 络 情况 ; 

a 系统 用 户 数量 及 并 发 用 户 数量 ; 

a 目前 系统 的 CPU 使 用 率 、 内 存 使 用 率 ; 

a 目前 VO 系统 状态 (平均 读 写 响 应 时 间 、1/O 等 待 时 间 等 ) 。 
然后 要 根据 系统 的 现状 ， 对 于 优化 的 目标 进行 定位 。 比 如 ， 优 化 〈 升 级 ) 后 要 达到 : 
O 平均 系统 响应 时 间 在 X 秒 以 内 ， 数 据 库 响应 时 间 在 X 秒 以 内 ; 
a CPU 使 用 率 保 持 在 80% 以 下 ， 

a 系统 内 存 使 用 率 保持 在 90% 以 下 ， 不 发 生 换 页 操作 ; 

a XX 统计 可 以 在 XX 分 钟 内 完成 ， 

a XX 操作， 操作 员 的 等 待 时 间 不 超过 XX 秒 钟 ， 














在 进行 数据 库 优化 之 前 , 首先 要 了 解 目前 系统 的 运行 状态 和 目前 系统 资源 的 使 用 情况 ， 了 解 


只 有 清晰 了 解 了 系统 目前 的 现状 , 才 有 可 能 形成 合理 的 优化 目标 , 为 整个 优化 工作 打下 一 个 
坚实 的 基础 。 优 化 目标 的 设 定 对 优化 的 成 败 至 关 重 要 , 目标 不 是 定 得 越 高 越 好 , 而 是 要 切合 实际 。 
数据 库 优 化 是 一 种 高 成 本 的 工作 ， 优 化 的 目标 越 高 ， 需 要 投入 的 成 本 也 越 高 ， 量 入 为 出 ， 才 能 制 


订 出 合理 的 优化 目标 ， 从 而 指导 整个 优化 工作 顺利 进行 。 


制订 优化 目标 时 , 除了 考虑 成 本 因素 外 , 还 要 考虑 可 以 用 于 实施 优化 工作 的 各 种 资源 以 及 它 
们 如 何 配合 。 比 如 要 做 SQL 优化 ， 就 需要 有 SQL 优化 的 专业 技术 人 员 参 与 ， 更 多 的 时 候 也 要 有 
应 用 开发 厂商 的 配合 。 如 果 这 些 资 源 不 能 够 协调 好 ， 那 么 SQL 优化 工作 的 成 效 就 要 大 打折 扣 了 。 
在 考虑 各 种 资源 的 时 候 ， 大 家 往往 会 忘记 一 个 资源 ， 那 就 是 时 间 。 任 何 一 个 优化 工作 都 是 有 时 间 


要 求 的 ， 如 何在 规定 的 时 间 玫 围 内 达到 优化 的 目的 ， 需 要 制订 优化 目标 的 人 充分 考虑 。 


在 优化 工作 中 ,存在 各 种 各 样 的 风险 ， 会 影响 优化 目标 的 实现 。 在 制订 优化 目标 时 ， 把 各 种 
风险 因素 考虑 进去 是 十 分 关键 的 。 除 了 在 制订 优化 目标 时 要 考虑 风险 因素 外 , 尽早 地 让 其 他 相关 





部 门 了 解 风险 的 存在 ， 提 高 其 风险 意识 和 抵御 风险 的 能 力 ， 也 是 优化 成 败 的 关键 。 
E 人 优化 澳 技 巧 ) 按部就班 是 成 功 的 关键 


今天 张 工 提出 了 , 我 们 能 否 提前 做 一 些 优化 工作 , 为 什么 我 会 拒绝 这 个 请 求 呢 ? 系统 优化 是 
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一 个 周期 较 长 的 项 目 , 而 需要 进行 全 面 优化 的 系统 一 般 来 说 都 存在 很 严重 的 问题 , 客户 希望 你 一 
进 现场 马上 就 给 系统 带 来 很 大 的 改善 ， 因 此 提出 提前 进行 优化 的 要 求 也 是 很 正常 的 。 

不 过 由 于 对 系统 的 了 解 是 逐步 深化 的 , 在 优化 项 目 初期 , 我 们 对 系统 的 认识 比较 片面 , 这 个 
时 候 采 取 任 何 优 化 动作 都 存在 较 大 风险 。 在 这 个 阶段 ,不 应 该 打 乱 原本 的 计划 ,提前 采取 任何 优 
化 措施 。 优 化 项 目 不 仅 仅 是 技术 问题 , 它 的 涉及 面 十 分 广泛 。 一般 来 说 , 优化 项 目的 发 起 者 是 IT 
部 门 ， 而 对 于 绝 大 多 数 客户 来 说 ， 业 务 部 门 才 是 考核 的 主体 ， 他们 的 感受 反馈 到 领导 那里 , 分 量 
会 比 代 部门 要 大 得 多 。 从 业务 部 门 来 说 ， 系 统 扩容 的 风险 远 比 优化 项 目 小 ， 因 此 他 们 和 IT SBT] 
往往 是 有 了 矛盾 的 。 优 化 过 程 中 出 现 了 某 些 变数 ， 从 而 导致 优化 项 目 天 折 的 案例 比比 皆 是 。 
因此 作为 优化 实施 团队 , 不 盲目 动作 是 十 分 关键 的 。 我 曾经 参加 过 一 个 项 目 , 优化 工作 开始 
后 一 个 多 星期 , 突然 他 们 的 运 维 部 主任 把 我 找 了 过 去 , 很 严厉 地 说 ,为 什么 我 们 做 了 优化 ， 系 统 
反而 更 差 了 。 我 告诉 他 说 , 我们 目前 主要 还 是 处 于 采集 数据 的 阶段 ， 不 会 对 系统 做 任何 调整 ， 所 
以 越 优化 系统 越 差 的 说 法 不 成 立 , 这 几 天 系统 性 能 不 好 主要 是 由 于 业务 部 门 在 开展 促销 活动 , 所 
以 业务 量 比 平时 高 了 不 少 。 主 任 如 释 重负 ， 说 :“ 只 要 不 是 你 们 搞 的 就 好 。 可 是 ， 这 几 天 业务 量 
比 平时 高 你 怎么 不 通知 我 ” 害 得 我 在 局 务 会 上 又 被 大 家 攻击 了。” 

大 多 数 有 经 验 的 DBA 能 够 很 好 地 控制 优化 项 目的 进程 ， 完 全 按照 自己 的 思路 往 前 走 ， 这 样 
的 项 目 控制 能 力 对 于 项 目的 成 功 是 十 分 关键 的 。 而 很 多 初次 参与 优化 项 目的 DBA 往往 过 于 急躁 ， 
总 想 一 下 子 就 解决 问题 , 或 者 尽快 露 一 小 手 给 客户 看 看 。 如 果 这 样 发 展 下 去 , 项 目 中 出 现 问 题 的 
机 会 就 加 大 了 。 所 以 说 , 在 一 个 优化 项 目 中 , 成 功 地 控制 项 目的 进度 , 使 之 在 自己 的 掌控 下 前 进 ， 
对 于 项 目 成 功 是 十 分 重要 的 。 


OMENS) 优化 常用 知识 2， 常 用 诊断 事件 清单 


Oracle 的 内 部 诊断 事件 相当 多 ， 在 一 些 复杂 的 诊断 与 优化 工作 中 ，DBA 也 经 常会 通过 诊断 
事件 去 分 析 问 题 ， 或 者 通过 设置 诊断 事件 去 解决 某 些 bug。 对 于 一 个 资深 的 DBA 来 说 ， 需 要 在 
日 常 工作 中 不 断 地 积累 这 方面 的 知识 。 下 面 这 张 表 是 老 白 收集 的 主要 事件 清单 ,不 过 有 很 多 事件 
老 白 也 没有 用 过 ， 大 家 在 使 用 时 要 十 分 慎重 。 


事 fk 说 — HB 5| + 


Event 10013 - Monitor 在 Startup 时 跟踪 事务 恢复 ALTER SESSION SET EVENTS '10013 trace 
Transaction Recovery name context forever, level 1'; 


Event 10015 - Dump Undo 在 事务 恢复 后 ,做 转 储 回 退 段 头 信息 ALTER SESSION SET EVENTS '10015 trace 
Segment Headers- name context forever, level 1'; 


Event 10032 - Dump Sort 转 储 排序 的 统计 信息 ALTER SESSION SET EVENTS '10032 trace 
name context forever, level 10'; 







































































Statistics 
Event 10033 - Dump Sort 排序 过 程 中 ,内 存 排序 区 和 临时 表 空 ALTER SESSION SET EVENTS '10033 trace 
Intermediate Run Statistics 间 的 交互 情况 name context forever, level 10'; 


























Event 10045 - Trace Free freelists 的 管理 操作 ALTER SESSION SET EVENTS '10045 trace 
List Management Operations name context forever, level 1'; 
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Event 10046 - Enable SQL 
Statement Trace 


Event 10053 - Dump 
Optimizer Decisions 


Event 10060 - Dump 
Predicates 


Event 10065 - Restrict 
Library Cache Dump Output 
for State Object Dumps 


Event 10079 - Dump 
SQL * Net Statistics- 


Event 10081 - Trace High 
Water Mark Changes 


Event 10104 - Dump Hash 
Join Statistics 


跟踪 SQL， 有 执行 计划 , 绑 定 变量 和 
等 待 的 统计 信息 ，Level 12 最 详细 。 
Level 的 定义 如 下 。 
Level1: SQL 语 句 , 执行 计划 和 执行 
Level 4; Level 1 的 信息 加 上 绑 定 变 
量 信息 。 
Level 8; Level 1 的 信息 加 上 等 待 
件 信息 。 
Level 12; Level 1 十 Level4 十 Level8 
在 分 析 SQL 语 句 时 , 转 储 出 优化 器 所 
做 的 选择 ，Level 1 最 详细 。 
Level 的 定义 如 下 。 
Levell; 状态 和 估算 信息 。 
Level 2: 只 显示 估算 信息 
转 储 SQL 语 句 中 的 断 语 信息 。 要 在 需 
要 转 储 的 用 户 下 创建 下 表 : 
CREATE TABLE 
kkoipt table(ci 
INTEGER, 
c2 VARCHAR2(80) 
); 
断 语 信息 会 写 入 该 表 
限制 对 象 状 态 转 储 的 时 候 , 库 缓 存 信 
息 的 详细 程度 。 
Level 的 定义 如 下 。 
Level 1: 只 包含 library 对 象 的 地 址 信 
自 


Level2; Level 1 的 信息 加 上 library 对 
象 锁 的 信息 。 

Level 3; Level 2 的 信息 加 上 Library 
对 象 及 对 象 句柄 。 

默认 是 Level3 

转 储 SQL*Net 的 统计 信息 


T 
8 
dk 
lin. 


TH 


















































跟踪 高 级 水 印 (HWM) 的 改变 


Hash 连 接 的 统计 信息 


ALTER SESSION SET EVENTS '10046 trace 


name context forever, 


ALTER SESSION SET EVI 
name context forever, 





ALTER SESSION SET EVI 
name context forever, 





ALTER SESSION SET EVI 
name context forever, 





ALTER SESSION SET EVI 
name context forever, 


ALTER SESSION SET EVI 
name context forever, 





ALTER SESSION SET EVI 
name context forever, 





level 12'; 


ENTS '10053 trace 
level 1'; 


ENTS '10060 trace 
level 1'; 


ENTS '10065 trace 
level level'; 


ENTS '10079 trace 
level 2'; 


ENTS '10081 trace 
level 1'; 





ENTS '10104 trace 
level 10'; 
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Event 10128 - Dump 
Partition Pruning Information 


Event 10200 - Dump 
Consistent Reads 


Event 10201 - Dump 
Consistent Read Undo 
Application 

Event 10220 - Dump 
Changes to Undo Header 

Event 10221 - Dump Undo 
Changes 

Event 10224 - Dump Index 
Block Splits / Deletes 


Event 10225 - Dump 
Changes to Dictionary 
Managed Extents 

Event 10231-Ship Corrupted 
Blocks on Table Scans 


Event 10241 - Dump 
Remote SQL Execution 


分 区 表 调 整 信息 。 在 9.0.1 或 者 后 面 的 








版 本 ， 在 Level 2 后 还 需要 建立 如 下 的 
表 : 





CREATE TABLE kkpap_pruning 
( 

partition count 
iterator 
VARCHAR2 (32), 
partition level 
VARCHAR2 (32), 
order pt 
VARCHAR2 (12), 
call time 
VARCHAR2 (12), 
part 
NUMBER, 
subp 
NUMBER, 

absit 

NUMBER 

hi 
Levellft f : 

1 Dump pruning descriptor for 
each partitioned object 

0x0002 Dump partition iterators 
0x0004 Dump optimizer decisions 
about partition-wise joins 

0x0008 Dump ROWID range scan 
pruning information 


转 储 一 致 读 的 信息 


NUMBER, 











转 储 一 致 读 涉及 Undo 信 息 的 内 容 


转 储 出 Undo 头 信息 的 改变 





转 储 Undo 的 改变 


转 储 索 引 块 的 分 裂 和 删除 信息 














转 储 字典 管理 的 扩展 变化 














全 表 扫 描 时 跳 过 坏 块 ,在 有 坏 块 的 情 





况 下 做 数据 拯救 时 很 有 用 


远程 SQL 语句 的 执行 信息 


ALTER SESSION SET EVENTS '10128 trace 





name context forever, 


ALTER SESSION SET EVENTS ' 


E 


name context forever, 


ALTER SESSION SET EVENTS ' 


name context forever, 


ALTER SESSION SET EVENTS ' 


name context forever, 


ALTER SESSION SET EVENTS ' 


Ë 


name context forever, 





ALTER SESSION SET EVENTS ' 


name context forever, 





ALTER SESSION SET EV] 
name context forever, 


ALTER SYSTEM SET EVENTS '1 





name context forever, 








ALTER SESSION SET EVI 
name context forever, 





level level'; 


L0200 trace 
level 1'; 


L0201 trace 
level 1'; 


L0220 trace 
level 1'; 
L0221 trace 
level 7'; 
L0224 trace 
level 1'; 
L0225 trace 
ques 


ENTS ' 
level 








0231 trace 

level 10'; 

ENTS '10241 trace 
level 1'; 
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Event 10246 - Trace PMON 
Process 


Event 10248 - Trace 
Dispatcher Processes 

Event 10249 - Trace Shared 
Server (MTS) Processes- 


Event 10270 - Debug 
Shared Cursors 


Event 10299 - Debug 
Prefetching 


Event 10357 - Debug Direct 
Path 


Event 10390 - Dump 
Parallel Execution Slave 
Statistics 


Event 10391-Dump Parallel 
Execution Granule Allocation 


Event 10393 - Dump 
Parallel Execution Statistics 


Event 10500 - Trace SMON 
Process 


Event 10511 - turn off 
SMON check to cleanup undo 
dictionary 

Event 10513 - disable 
transaction recovery 


Event 10608 - Trace Bitmap 
Index Creation 


Event 10704 - Trace 
Enqueues 


Event 10706 - Trace Global 
Enqueue Manipulation 

Event 10708 - Trace RAC 
Buffer Cache 

Event 10710 - Trace Bitmap 
Index Access 


Event 10711 - Trace Bitmap 
Index Merge Operation 


Event 10712 - Trace Bitmap 
Index OR Operation 


Event 10713 - Trace Bitmap 
Index AND Operation 


Event 10714 - Trace Bitmap 
Index MINUS Operation 


跟踪 PMON 进 程 。 只 能 修改 参数 , 不 
能 用 ALTER SYSTEM 


跟踪 Dispatcher 进 程 的 工作 情况 








跟踪 共享 服务 器 进程 的 工作 情况 


跟踪 表 数 据 块 和 索引 数据 块 的 Pre- 


fetching 





调试 直接 路 径 





转 储 并 





的 统计 信息 


D 


转 储 并 











行 操作 中 从 属 进程 (slave) 





行 操作 的 粒度 


转 储 并 行 操 作 的 统计 信息 (每 个 从 
进程 单独 列 出 ) 
跟踪 SMON 进 程 





wal 








关闭 SMON 检 查 并 清理 undo 数 据 字 


AN 











关闭 延迟 的 事务 恢复 


跟踪 位 


跟踪 锁 


跟踪 位 


跟踪 位 


























AR] 








"si 














"si 
































索引 创建 的 详细 过 程 








的 使 用 情况 





跟踪 全 局 锁 的 使 用 情况 


跟踪 RAC 环 境 下 的 Buffer Cache 


索引 的 访问 情况 


索引 合并 操作 


索引 或 操作 情况 





索引 与 操作 


索引 MINUS 操 作 的 情况 


event = "10246 trace name context 
forever, level 1" 


event = "10248 trace name context 
forever, level 10" 


event = "10249 trace name context 
forever, level 10" 


event = "10270 trace name context 
forever, level 10" 


event = "10299 trace name context 
forever, level 1" 


ALTER SESSION SET EVENTS '10357 trace 
name context forever, level 1'; 


ALTER SESSION SET EVENTS '10390 trace 
name context forever, level 1; 


ALTER SESSION SET EVENTS '10391 trace 
name context forever, level 2'; 














ALTER SESSION SET EVENTS '10393 trace 
name context forever, level 1'; 














event - "10500 trace name context 
forever, level 1" 


event-"10511 trace name context 
forever, level 1" 


event-"10513 trace name context 
forever, level 2" 


ALTER SESSION SET EVENTS '10608 trace 
name context forever, level 10'; 


ALTER SESSION SET EVENTS '10704 trace 
name context forever, level 1'; 








ALTER SESSION SET EVENTS '10706 trace 
name context forever, level 1'; 


ALTER SESSION SET EVENTS '10708 
trace name context forever, level 10'; 





ALTER SESSION SET EVENTS '10710 trace 
name context forever, level 1'; 


ALTER SESSION SET EVENTS '10711 trace 
name context forever, level 1'; 


ALTER SESSION SET EVENTS '10712 trace 


name context forever, level ; 


ALTER SESSION SET EVENTS '10713 trace 
name context forever, level 1'; 
































ALTER SESSION SET EVENTS '10714 trace 
name context forever, level 1'; 
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事 Off 说 了 明 b| T 

Event 10715 - Trace Bitmap 跟踪 位 图 索引 转换 为 RowID 操 作 的 ALTER SESSION SET EVENTS '10715 trace 
Index Conversion to ROWIDs ”情况 name context forever, level I'; 
Operation 

Event 10716 - Trace Bitmap 跟踪 位 图 索引 压缩 和 解压 缩 情况 ALTER SESSION SET EVENTS '10716 trace 
Index Compress/Decompress name context forever, level 1'; 

Event 10717 - Trace Bitmap 诊断 位 图 索引 ALTER SESSION SET EVENTS '10717 trace 
Index Compaction name context forever, level 1'; 

Event 10719 - Trace Bitmap 跟踪 位 图 索引 列 的 DML 操 作 (引起 ALTER SESSION SET EVENTS '10719 trace 
Index DML 位 图 索引 改变 的 DML 操 作 ) name context forever, level 1'; 

Event 10730 - Trace Fine 跟踪 细 粒 度 访问 的 断 语 ALTER SESSION SET EVENTS '10730 trace 
Grained Access Predicates name context forever, level 1'; 

Event 10731 - Trace 跟踪 游标 语句 。Level 的 定义 如 下 : ALTER SESSION SET EVENTS '10731 trace 
CURSOR Statements Mc N name context forever, level level'; 

1 一 一 显示 父 查询 和 子 查询 。 
2 一 一 只 显示 子 查 询 

Event 10928 - Trace 跟踪 PL/SQL 执 行情 况 ALTER SESSION SET EVENTS '10928 trace 
PL/SQL Execution name context forever, level 1'; 

Event 10938 - Dump 转 储 PL/SQL 执 行 状 态 。 使 用 前 需要 ALTER SESSION SET EVENTS '10938 


PL/SQL Execution Statistics 


flush cache 


DROP SEGMENTS 





执行 rdbms/admin 下 的 tracetab.sql 
刷新 Buffer Cache 

手工 删除 临时 段 。 当 这 些 临时 段 无 法 

9 动 清 除 时 ， 可 以 手工 清除 。ts# 是 指 

要 删除 临时 段 的 表 空 间 的 ts# 


























trace name context for 


ALTER SESSION SET EVI 


trace name flush cache'; 





ALTER SESSION SET EVI 
trace name DROP SEGMENT 








ever, level 1'; 


ENTS 'immediate 


ENTS 'immediate 
[rS level ts#+1'; 





Z 
h 


* mage 


Wr e- e—e e 
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今天 是 星期 六 , 但 是 为 了 赶 项 目 进 度 , 我 们 三 方 也 没有 休息 就 召开 了 三 方 联席 工作 会 议 。 说 
是 三 方 ， 实际 上 是 四 方 ， 除了 甲 方 、 应 用 开发 商 和 我 们 外 ， 北 方 公司 IT 部 的 领导 也 通过 电话 会 
议 的 方式 参与 了 部 分 讨论 。 

老 方 和 小 齐 是 昨 晚 坐 火车 从 北京 赶 过 来 的 , 早上 一 下 火车 就 立马 赶 到 位 于 浑 南 的 总 部 。 虽然 
之 前 已 经 在 好 儿 个 项 目 上 和 小 齐 、 老 方 合作 过 , 但 是 我 们 都 是 通过 电话 和 电子 邮件 沟通 。 正 式 面 
对 面 和 他 们 打交道 还 是 第 一 次 。 之 前 和 老 方 通过 儿 次 电话 ， 不 过 我 两 年 前 就 听 说 过 他 这 个 人 了 。 
那 时 我 受 邀 参加 了 海尔 售后 服务 系统 (HCSP ) 优化 的 项 目 , 那 是 一 个 由 HP 总 集成 的 项 目 。HCSP 
系统 自从 上 线 后 一 直 存 在 性 能 问题 到 了 2004 年 7 月 ， 性 能 问题 已 经 导致 了 系统 无 法 继续 上 线 
新 的 网 点 ， 因 此 必须 尽快 解决 性 能 问题 ， 才 能 确保 系统 按时 上 线 。 我 和 人 场 后 看 到 的 第 一 个 文档 就 
是 老 方 写 的 关于 HCSP 系统 的 优化 建议 。 文 档 写 得 比较 简略 ， 大 概 不 到 20 页 ， 不 过 文档 中 提 到 
的 主要 问题 以 及 解决 问题 的 方法 , 基本 上 和 我 经 过 儿 天 分 析 后 的 想法 一 致 。 我 当时 就 问 客户 , 看 
这 个 文档 , 我 感觉 那个 人 基本 上 抓 住 了 问题 的 要 点 ， 如果 这 么 实施 下 去 ， 应 该 可 以 解决 问题 ,为 
什么 没有 让 他 继续 完成 这 个 项 目 呢 ， 因 为 我 来 做 这 个 项 目 , 方向 上 不 会 有 太 大 的 变化 。 客 户 说 他 
也 不 太 清 楚 ， 那 个 人 来 了 一 次 ， 就 不 愿意 再 来 了 。 这 让 我 感到 十 分 放 异 ， 有 钱 都 不 愿意 赚 的 人 还 
是 比较 少 的 。 后 来 过 了 不 多 入， 就 听 说 老 方 加 盟 了 HP 公司 ， 在 HP 公司 的 高 级 服务 团队 里 做 了 
负责 Oracle 优化 服务 的 售 前 。 

开发 厂商 来 了 一 个 重量 级 的 人 物 一 一 范 总 ,他 以 前 是 这 个 项 目的 项 目 经 理 , 现在 已 经 是 这 个 
产品 的 产品 线 经 理 了 。 由 于 这 个 项 目 是 范 总 亲自 带 队 完成 的 , 因此 他 对 目前 客户 系统 的 情况 十 分 
清楚 , 孙 主 任 也 一 再 要 求 他 亲自 担任 优化 项 目 开发 方 的 负责 人 。 这 种 联席 会 开 得 不 好 就 会 成 为 务 
虚 会 ， 这 也 是 我 最 担心 的 。 从 人 员 上 ,开发 商 参 与 会 议 的 包括 范 总 和 我 们 认识 的 小 孙 ， 我 们 这 边 
人 到 得 很 齐 , 除了 三 个 现场 项 目 实施 的 , 项 目 经 理 小 齐 和 总 协调 老 方 也 都 赶 到 现场 ， 客 户 这 边 负 
员 IT 维护 的 孙 主 任 和 张 工 他 们 悉数 到 场 。 

会 议 从 一 开始 就 开 得 很 热烈 ， 气 氛 也 很 好 ， 大 家 都 是 豪言壮语 ， 谈 笑 风 生 。 由 于 这 种 会 议 没 
有 什么 压力 ， 所 以 大 家 都 表现 出 幽默 和 机 智 。 不 过 我 自己 觉得 , 在 会 议 过 程 中 收获 的 东西 太 少 , 至 
少 从 应 用 开发 厂商 与 会 代表 的 慷慨 陈 词 中 ,我 感受 到 了 很 大 的 压力 。 因 为 以 往 经 验 告诉 我 , 在 这 个 
项 目 里 应 用 开发 厂商 的 配合 肯定 不 会 很 好 。 这 次 会 议 把 客户 、 开 发 商 、 优 化 厂商 之 间 的 职责 、 接 口 、 
升级 流程 都 确定 了 下 来 , 也 确定 了 每 个 流程 的 里 程 碑 以 及 责任 人 。 我 在 这 个 项 目 中 总 体 负责 应 用 优 
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it, 所 以 在 讨论 前 面 一 些 问 题 时 , 我 一 直 没 有 开口 。 而 谈 到 接口 时 , 我 一 再 强调 我 们 不 直接 和 开发 
商 接口 ， 我 们 的 优化 建议 必须 通过 客户 确认 ， 然 后 由 客户 直接 下 达 给 开发 商 。 这 个 要 求 一 提出 , 客 
户 和 开发 商都 提出 了 反对 意见 , 觉得 这 是 多 此 一 举 。 刚 开始 讨论 这 个 问题 时 , 开发 商 认为 这 个 接口 
应 该 是 我 们 和 开发 商 之 间 直 接 的 接口 , 不 需要 经 过 甲 方 。 甲 方 的 意思 也 是 这 个 项 目 我 们 和 和 集成 商都 
是 参与 方 , 客户 对 双方 都 是 支付 了 费用 的 ， 所 以 客户 要 的 就 是 最 后 的 优化 效果 ,至 于 中 间 我 们 和 集 
成 商 如 何 协商 ， 那 就 是 我 们 自己 的 事情 了 ， 如 果 还 要 通过 他 们 转 一 下 ， 必 定 会 影响 效率 。 

我 坚决 反对 这 种 接口 模式 。 以 往 的 经 验 告诉 我 , 集成 商 可 以 买 客户 的 账 , 但 是 绝对 不 会 买 我 
们 的 账 。 在 优化 项 目 中 ,我 们 的 工作 成 果 越 大 ， 开 发 商 的 工作 量 也 越 大 ， 而 开发 商 是 不 会 对 优化 
项 目的 成 败 负责 的 , 因此 他 们 在 这 个 项 目 中 做 的 事情 越 少 越 划 算 。 最早 理解 我 的 想法 的 是 孙 主 任 ， 
他 很 快 就 明白 我 为 什么 坚持 这 种 接口 模式 , 所 以 孙 主 任 很 快 就 改变 了 开始 的 态度 , 转 而 支持 我 了 。 
当 我 和 和 孙 主 任 反 复 坚 持 这 种 接口 模式 时 , 小 齐 和 老 于 还 感到 有 点 惊讶 ,觉得 在 这 方面 我 似乎 大 惊 
小 怪 了 。 很 快 ， 老 方 也 明白 了 我 的 意思 ， 坚 决 站 在 我 这 边 了 。 最 后 在 我 们 三 个 的 一 再 坚持 下 ， 应 
用 开发 商 同意 了 这 种 接口 模式 。 而 老 方 更 绝 ， 当 客户 和 开发 商 同意 后 ， 老 方 一 再 强调 今天 的 会 议 
纪要 应 在 会 后 马上 打印 出 来 ， 儿 方 一 定 要 在 会 议 纪要 上 签字 。 

由 于 折腾 着 打印 签字 ， 本 来 12 : 00 准时 结束 的 会 议 被 拖 到 了 12 : 30。 中 午 是 小 齐 请客 , 他 
们 吃 完 饭 还 要 赶 回 北 京 向 北方 公司 领导 汇报 ， 所 以 吃饭 就 安排 在 北 站 的 “新 洪 记 ”。 由 于 人 太 多 ， 
分 开 坐 了 两 辆 出 租车 ， 老 于 他 们 三 个 人 先 走 了 一 步 ， 我 和 小 齐 、 老 方 坐 了 一 辆 出 租车 。 在 车 上 ， 
我 把 自己 的 担忧 告诉 了 小 齐 :“ 我 觉得 开发 商 不 会 十 分 配合 这 个 项 目 ， 我 们 可 能 要 面临 狐 军 奋战 
的 不 利 局 面 。 云 南 联通 那 种 情况 在 沈阳 不 会 重演 。” 云 南 联通 是 小 齐 做 的 第 一 个 优化 项 目 ， 实 施 
是 我 做 的 ， 当 时 由 于 应 用 软件 还 没有 验收 ,开发 团队 还 在 客户 现场 做 验收 阶段 的 工作 ， 因 此 和 我 
们 配合 得 十 分 好 。 我 们 指出 存在 问题 的 SQL , 他 们 马上 安排 开发 人 员 和 我 们 一 起 分 析 和 解决 问题 。 
看 样子 小 齐 对 目前 这 种 情况 并 无 思想 准备 ， 所 以 听 到 我 这 么 说 之 后 就 有 点 着 急 , 掏 出 电话 就 想 直 
接 找 北 方 公司 领导 协调 。 老 方 制止 了 小 齐 ， 并 对 我 说 :“ 老 白 ， 你 性 子 太 急 ， 这 话 我 准备 在 火车 
上 和 小 齐 说 的 。 这 个 问题 我 也 看 出 来 了 ,而 且 十 分 严重 , 但 是 目前 找 领导 还 不 是 时 候 。 因 为 这 个 
问题 目前 还 只 是 我 们 的 猜测 ， 虽 然 这 个 猜测 成 立 是 100% 的 ， 我 们 甚至 要 做 好 项 目 因此 被 迫 延 迟 
的 思想 准备 。” 小 齐 一 听 老 方 说 项 目 会 延期 ， 当 时 就 急 了 。 由 于 这 个 项 目 是 样板 项 目 ， 关 系 到 后 
续 其 他 几 省 合同 的 问题 ， 因 此 不 能 延 后， 否则 老板 那 边 交代 不 过 去 。 我 只 好 安奈 小 齐 说 :“ 没 关 
系 ， 再 困难 的 项 目 我 们 也 见 过 ， 这 里 再 困难 也 不 会 有 海尔 困难 吧 ， 那 个 项 目 我 们 不 也 拿 下 来 1 

饭桌 上 没有 再 谈 这 个 话题 , 这 是 我 建议 的 , 老 于 的 压力 已 经 够 大 了 , 不 能 再 给 他 施加 压力 了 。 
在 饭桌 上 我 问 了 老 方 ,为 什么 海尔 的 项 目 他 已 经 做 到 那 种 地 步 ， 反 而 退出 了 。 老 方 告诉 我 ， 当 时 
是 有 个 高 人 建议 他 退出 的 ， 因 为 客户 、 原 厂 和 和 集成 商 三 家 打 得 不 可 开交 ， 集 成 商 (也 就 是 软件 开 
发 商 ) 基本 上 采取 对 抗 的 态度 ， 所 以 他 觉得 这 个 项 目 很 难 推进 ， 弄 不 好 把 一 世英 名 都 搭 进去 了 ， 
不 划算 。 想 想 我 当年 如 履 薄 冰 的 样子 ， 确 实 也 像 老 方 所 说 的 情况 。 做 DBA 的 ， 想 干 成 功 一 百 个 
项 目 容 易 ， 想 不 干 磺 一 个 项 目 却 很 难 ， 大 家 可 能 不 会 长 久 记得 你 的 成 功 ,而 你 的 每 一 次 失败 都 会 
被 永久 地 流传 在 这 个 行业 里 , 确实 需要 像 鸟 儿 爱 惜 羽毛 一 样 爱惜 自己 的 声誉 , 因为 这 关系 到 你 的 
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饭碗 。 老 方 也 很 佩服 我 当时 敢 把 那个 地 雷 接 到 手 里 ,这 个 不 可 能 完成 的 任务 在 我 之 前 还 有 其 他 好 
JLA DBA 曾经 去 过 ， 都 是 去 了 一 次 就 决定 退出 了 。 

海尔 项 目的 成 功 有 很 多 因素 。 当 年 做 海尔 项 目 时 ,我 在 优化 方面 的 功底 并 不 次 厚 ， 只 是 做 过 
一 些小 型 的 优化 项 目 。 赦 于 第 一 次 出 手 就 拿 这 样 没 谱 的 项 目 试 刀 , 我 的 那 种 车 到 山 前 必 有 路 的 信 
念 是 支撑 我 完成 这 个 项 目的 关键 。 很 多 次 山 穷 水 尽 的 时 候 我 都 坚持 下 来 了 ， 有 些 手段 现在 想来 也 
算 不 上 正道 ， 而 且 成 功 也 存在 很 多 偶然 因素 ， 不 过 我 确实 取得 了 令 人 不 可 思议 的 成 功 。 

由 于 是 中 午 , 不 能 喝酒 , 所 以 大 家 要 了 一 大 瓶 可 乐 , 点 了 儿 个 东北 菜 ， 当然 少 不 了 “新 洪 记 ” 
最 有 特色 的 水 饺 。 大 家 基本 上 没 怎 么 谈 项 目的 事情 ， 由 于 没有 喝酒 ， 老 省 的 压力 比较 小 ,所 以 话 
也 较 多 。 这 些 人 里 , 除了 小 齐 比较 年 轻 ， 其 他 人 都 在 IT ARET 10 多 年 了 ， 所 以 大 家 聊 的 都 是 
Oracle 圈子 里 的 一 些 往事 ,其 至 聊 到 了 当年 的 北京 巨 龙 ， 那 批 中 国 搞 Oracle 的 先驱 ,其 中 大 多 数 
人 都 已 经 功 成 身 退 ， 其 至 很 多 人 已 经 移民 海外 了 。 老 肖 当 年 是 甲 方 , 是 巨 龙 最 大 的 客户 ， 那 场 友 

















说 起 这 段 往事 , 让 人 确实 觉得 圈子 太 小 , 通过 6 个 人 可 以 在 地 球 上 任何 两 个 人 之 间 建 立 联 系 ,“ 六 
度 空 间 ” 之 说 确实 不 虚 。 谈 到 了 当年 巨 龙 的 成 功 与 失败 ， 大 家 都 唤 咕 不 已 。20 世纪 90 年 代 中 期 
崛起 的 这 个 中 国 最 早 的 Oracle 第 三 方 服 务 厂 商 ， 其 中 绝 大 多 数 人 员 都 是 从 Oracle 出 来 的 ， 销 售 
能 力 、 技 术 力 量 都 不 逊色 于 当年 的 Oracle 中 国 区 。 在 那个 版 权 意识 尚 处 于 萌芽 状态 的 时 期 , EJ 
的 盗版 软件 的 概念 也 吸引 了 大 批 既 需要 上 大 型 数据 库 系统 ， 又 不 希望 出 太 多 银子 的 客户 。 他 们 是 
有 机 会 成 为 中 国 的 EDS 的 ， 不 过 最 终 他 们 并 没有 成 功 ， 主 要 原因 还 是 因为 分 裂 ， 最 终 巨 龙 分 裂 
成 几 家 小 公司 ， 这 些小 公司 再 也 没有 像 巨 龙 一 样 辉 煌 过 。 一 个 团结 的 巨 龙 可 以 成 功 ， 而 分 裂 只 能 
带 来 一 些 平庸 的 小 公司 ， 它 们 在 历史 的 长 河 里 跃 动 了 几 下 ， 就 像 泡 沫 一 样 消 失 在 浪花 里 了 。 
午饭 后 ， 老 方 和 小 齐 就 动身 回 北 京 了。 今天 是 周 六 ,下 午 没 什么 事情 了 ,我 和 老 肖 准 备 回去 
休息 ， 老 于 觉得 不 放心 ， 坚 持 要 去 机 房 看 看 系统 。 于 是 大 家 约 好 晚上 一 起 喝 点 酒 ,我 和 老 肖 就 回 
宾馆 了 。 沈 阳 有 太 多 的 朋友 ， 所 以 不 敢 轻 易 露 尖 , 一 旦 露 了 一 小 脸 ， 那 无 穷 无 尽 的 酒会 就 接 吗 而 
至 了 。 所 以 我 只 打 电 话 通知 了 老 张 ， 老 张 是 我 从 小 一 起 长 大 的 朋友 ,， 情 同 手 足 ， 他 本 来 在 外 地 做 
MEA, 正好 今天 晚上 回来 ,于 是 约 好 周 日 晚上 一 起 去 喝酒 。 他 又 叫 上 他 的 几 个 朋友 ， 他们 都 是 我 
认识 的 。 和 他 圈子 的 朋友 喝酒 相对 还 是 比较 安全 的 , 不 会 牵 出 太 多 的 社会 关系 ， 这样 被 放 倒 的 次 
数 也 就 大 大 减少 了 ， 这 是 我 回 沈 阳 的 一 贯 做 法 。 
o» Sarit 









































在 优化 项 目 中 , 如何 和 开发 商 或 者 集成 商 配合 是 个 难题 ， 因 为 优化 不 可 避免 地 会 涉及 一 些 数 
据 库 以 外 的 东西 。 比 如 ， 要 调整 底层 存储 的 配置 ， 需 要 修改 一 些 存在 问题 的 SQL。 而 这 部 分 调整 
的 主动 权 不 是 掌握 在 我 们 手 里 ， 因 此 老 白 不 希望 直接 和 开发 商 接 触 ， 在 这 种 情况 下， 我 们 一 定 和 
甲 方 站 在 一 起 去 面 对 开 发 商 ， 因 为 甲 方 手 里 往往 都 有 制约 开发 商 的 手段 ， 而 我 们 没有 。 如 果 我 们 
直接 和 开发 商 接触 ， 开 发 商 不 想 配合 的 话 ， 是 很 难 推进 的 。 因 此 在 优化 项 目 中 ， 如 果 发 现 开发 商 
很 难 缠 ， 那 么 就 要 尽量 避免 直接 面 对 开 发 商 ， 优 化 方案 要 通过 开发 商 提交 给 甲 方 ,并 由 甲 方 负责 
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监督 优化 进度 。 当 然 在 优化 过 程 中 ， 和 开发 商 直 接 沟通 是 有 必要 的 。 比 如 ,开发 商 需要 你 向 他 们 
介绍 你 的 方案 ,那么 你 就 要 尽 可 能 地 满足 他 们 的 要 求 。 当 然 也 可 能 在 有 些 情况 下 ,开发 商 的 配合 
十 分 好 ， 那 么 直接 面 对 开发 商 ， 效 率 要 高 得 多 。 

由 于 沈阳 这 个 项 目 甲 方 是 十 分 积极 的 , 他 们 对 项 目 成 败 的 渴望 并 不 亚 于 老 白 他 们 自身 , 所 以 
甲 方 是 值得 信赖 和 依靠 的 。 在 这 种 情况 下 ， 老 白 选择 了 通过 甲 方 将 任务 下 达 给 开发 商 的 方式 , 这 
个 方式 虽然 看 起 来 效率 不 高 ， 不 过 却 是 此 时 唯一 的 选择 。 如 果 由 老 白 他 们 直接 和 开发 商 沟通 , BS 
么 会 产生 更 多 的 摩擦 ， 效 率 可 能 更 为 低下 。 


SREE) 优化 流程 


1. 数据 采集 

制订 完 优化 目标 后 , 需要 进一步 对 系统 中 的 数据 进行 采集 和 分 析 。 数 据 采 集 包括 操作 系统 数 
据 和 数据 库 的 数据 。 对 于 不 同 的 系统 状态 和 不 同 的 优化 目标 ， 采 集 的 数据 也 有 所 不 同 。 

对 于 操作 系统 数据 的 采集 ， 可 以 使 用 vmstat、top、sar、iostat、netstat 等 工具 进行 。 对 于 不 
同 的 操作 系统 ， 其 命令 可 能 略 有 不 同 。 对 于 HP-UX, glance 是 不 错 的 性 能 分 析 工 具 ， 在 AIX 上 
可 以 使 用 nmon。Oracle 提供 了 一 个 很 不 错 的 OS 监控 工具 OSW (Metalink Nodes 301137.1), 也 
可 以 使 用 OSW 来 对 OS 进行 监控 。 

对 于 数据 库 数据 的 采集 ， 可 以 通过 多 种 方式 进行 。 首 先 ， 进 行 一 次 STATSPACK 分 析 (对 于 
Oracle 8 以 前 的 版 本 ， 可 以 使 用 bstat/estat 工具 采集 数据 ; 对 于 Oracle 10g 或 者 更 新 的 版 本 ， 可 以 
使 用 AWR 报告 ADDM 报告 和 ASH 报告 )。 根 据 STATSPACK 报告 ， 可 以 分 析出 很 多 数据 库 目 
前 的 状态 信息 。 根 据 这 些 情 况 ， 再 进行 进一步 的 分 析 。 如 果 你 使 用 的 是 Oracle 10g 或 者 更 高 的 版 
本 ， 还 可 以 通过 ASH 来 分 析 会 话 的 情况 。 

Toad 也 是 一 个 数据 库 状 态 采集 很 有 效 的 工具 。 通 过 Toad 中 的 健康 检查 工具 ， 可 以 找 出 目前 
系统 中 的 不 健康 因素 。 通 过 SGA 工具 ， 可 以 定位 开销 比较 大 的 SQL 语句 。 

OEM 中 的 诊断 包 和 调 优 包 是 采集 数据 库 状态 信息 的 很 有 效 的 工具 。 使 用 OEM 的 实时 监控 工 
具 的 挖掘 功能 ， 可 以 很 方便 地 进行 问题 定位 。 如 果 是 Oracle 10g 的 数据 库 ， 那 么 可 以 直接 使 用 
ADDM 去 分 析 数 据 库 的 性 能 。 

很 多 DBA 都 有 一 些 采 集 数 据 的 独门 秘笈 ， 根 据 不 同 的 数据 库 的 情况 ， 准 备 一 些 数据 库 性 能 
状态 采集 的 脚本 是 十 分 必要 的 。 作 为 性 能 优化 人 员 , 应 该 准备 以 下 方面 的 数据 库 脚本 (部 分 脚本 
的 功能 可 以 由 OEM、Spot light 等 工具 实现 ): 

O 数据 库 主 要 表 、 索 引 、 分 区 、 表 空间 等 情况 的 信息 采集 脚本 ， 
a 数据 库 表 的 主要 约束 关系 情况 的 采集 脚本 ， 

O 获取 某 个 数据 库 对 象 的 DDL 语句 的 脚本 ; 

a 数据 库 参数 的 采集 脚本 (包含 隐 含 参数 ) ; 

a 主要 缓冲 区 命中 率 情况 的 采集 脚本 ， 

a SQL 缓冲 区 分 析 脚 本 ; 
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a 获取 长 时 间 运 行 的 SQL 脚本 ， 
a 共享 池 分 析 的 脚本 ， 
a 系统 等 待 事件 分 析 的 脚本 ，; 
a 门 锁 竞争 情况 采集 脚本 ，; 
a 主要 文件 IO 性 能 分 析 的 脚本 ， 
a Top 会 话 分 析 的 脚本 ，; 
a 会 话 跟 踪 的 脚本 ， 
a OPS/RAC 性 能 分 析 的 脚本 (可 以 使 用 Oracle 提供 的 分 析 脚 本 ， 在 ?/rdbms Hoe F); 
a 表 空 间 碎片 分 析 的 脚本 。 

部 分 脚本 可 以 在 rdbms 目录 下 找到 。 另 外 ，Metalink 上 也 有 大 量 脚本 可 以 参考 。 平 时 积 
累 一 些 有 用 的 数据 库 分 析 和 数据 采集 脚本 可 以 大 大 提高 数据 采集 的 效率 。 每 个 DBA 都 应 该 
根据 自己 维护 的 数据 库 的 特点 ， 积 累 自 己 的 “独门 秘笈 。 

采集 数据 是 一 个 十 分 严密 的 过 程 。 如 果 这 个 阶段 采集 的 数据 不 准确 , 那么 会 导致 优化 计 
划 的 针对 性 不 强 ， 从 而 导致 优化 失败 。 因 此 ， 应 该 在 数据 库 的 不 同 状态 点 (或 者 时 间 点 ) 进 
行 多 次 数据 采集 ， 而 且 相 同 的 状态 点 (或 者 时 间 点 ) 最 好 进行 多 次 采集 ， 并 进行 对 比 ， 找 出 
共同 点 。 如 果 发 现 某 个 状态 点 两 次 采集 的 数据 差别 比较 大 ， 那么 就 需要 继续 采集 数据 ， 直 到 
所 有 的 数据 库 状态 都 可 以 被 清晰 地 分 析出 来 为 止 。 

另外 ， 在 采集 数据 的 时 候 ， 要 注意 像 交 响 乐 一 样 ， 每 个 系统 都 是 有 自己 独特 的 “节奏 ”的 ， 
这 里 所 说 的 “节奏 ”其 实 就 是 每 个 系统 独 有 的 运行 特征 。 每 个 系统 的 闲 时 、 忙 时 、 业 务 高 峰 都 有 
一 定 的 特征 ， 在 某 个 时 间 段 执行 的 程序 也 有 一 定 的 规律 。 作 为 优化 团队 ， 在 采集 数据 之 前 ,就 应 
该 通过 甲 方 或 者 集成 商 、 应 用 开发 商 了 解 这 个 系统 的 “节奏 ”， 以 便于 制定 有 针对 性 的 数据 采集 
计划 。 甚 至 更 严格 地 说 ， 系 统 的 节奏 会 决定 整个 优化 项 目 进 场 的 时 间 。 如 果 进 场 时 间 未 能 根据 系 
统 的 节奏 进行 安排 , 我 们 其 至 可 能 白白 浪费 时 间 。 比 如 说 一 套 电信 的 计 费 账 务 系统 ， 这 个 系统 的 
特点 是 平时 这 套 系 统 的 业务 量 比 较 平均 , 不 会 引起 明显 的 性 能 问题 , 但 是 每 个 月 的 月 底 到 月 初 这 
段 时 间 ， 由 于 出 账 、 集 中 销 账 等 业务 的 存在 ， 可 能 导致 系统 负载 大 幅度 增长 。 因 此 ， 针 对 这 种 系 
统 ， 我 们 的 数据 采集 一 定 要 在 25 日 之 前 开始 ， 持 续 到 业务 高 峰 结束 的 下 个 月 10 日 左右 。 在 安排 
这 样 的 项 目的 时 候 , 我 们 一 定 要 在 20 日 左右 就 能 够 进 场 ， 如果 错过 了 30 日 到 下 个 月 5 日 这 段 业 
务 最 高 峰 的 时 间 ， 可 能 就 会 浪费 一 个 月 的 时 间 。 

2. 优化 方案 设计 

所 有 的 数据 库 和 系统 状态 都 已 经 采集 完毕 ， 并 确认 数据 准确 以 后 ， 就 需要 对 这 些 数据 进行 进 一 
步 的 分 析 ， 通 过 分 析 制 订 出 优化 计划 。 这 时 ， 可 能 会 发 现 需 要 采集 更 多 数据 才能 够 定位 问题 ， 因 此 
就 要 进行 数据 补充 ， 直 到 所 有 数据 都 能 够 分 析 清 楚 ， 并 形成 有 针对 性 的 优化 方案 为 止 。 

制订 优化 计划 一 般 来 说 无 法 由 一 个 人 完成 , 而 要 由 一 个 专家 团队 来 完成 。 某 方面 的 专家 可 以 
提出 自己 对 某 个 专题 的 计划 , 最 后 汇总 为 一 个 统一 的 计划 。 优 化 计划 形成 后 ,需要 由 一 个 专业 的 
技术 小 组 来 审核 该 计划 。 专 业 小 组 应 该 包括 下 列 人 员 : 
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a 应 用 开发 方 的 技术 代表 ; 

a 小 型 机 (服务 器 ) 技术 专家 ， 

a 网 络 管理 员 ， 

口 Oracle 专家 和 DBA; 

a 系统 架构 师 ; 

a 用 户 代表 。 

一 份 优化 计划 应 该 包括 : 

a 系统 软 硬 件 及 网 络 调整 和 数据 库 调整 方案 ; 

a 优化 方案 涉及 的 所 有 脚本 ; 

a 详尽 的 系统 优化 操作 时 间 表 ， 需 要 列 出 每 个 步骤 的 起 始 和 终止 时 间 ， 

a 优化 完成 后 的 检查 方案 ( 含 脚本 ); 

a 优化 过 程 出 现 问 题 的 处 理 预案 。 

在 制订 优化 实施 计划 时 , 一 定 要 考虑 保留 足够 的 时 间 进 行 必 要 的 备份 和 保留 系统 检查 及 回 退 
的 时 间 。 对 于 有 一 定 风 险 性 的 操作 ， 一 定 要 进行 备份 ， 或 者 保证 有 可 用 的 备份 集 可 以 用 于 恢复 ， 
并 且 在 近期 有 系统 的 全 备份 ， 这 可 以 保证 恢复 的 时 间 。 一 旦 优化 失败 或 者 遇 到 一 些 问 题 ,， 可 能 需 
要 进行 回 退 操作 或 者 其 他 处 理 , 如 果 没有 预 留 这 部 分 时 间 , 在 优化 过 程 中 发 生 问题 时 将 没有 足够 
的 时 间 进 行 处 理 ， 从 而 影响 系统 的 正常 运行 。 

实施 计划 制订 完成 后 , 一 定 要 经 过 专家 小 组 的 审核 。 参与 的 专家 一 定 要 对 实施 计划 的 每 个 细 
节 进 行 审 核 ， 并 且 对 实施 计划 中 的 时 间 表 进行 确认 ， 确 保 时 间 表 是 可 行 的 。 

优化 工作 不 可 能 100% 顺 利 完成 ， 而 DBA 的 责任 是 保障 在 任何 情况 下 ， 系 统 都 能 够 正常 运行 。 
因此 ， 优 化 计划 应 该 包含 足够 的 应 急 预 案 ， 以 应 对 在 优化 工作 中 磁 到 的 各 种 异常 情况 。 对 于 难度 比 
较 大 的 优化 工作 来 说 ， 应 急 预 案 是 优化 工作 的 有 利 保障 。 应 急 预 案 中 应 该 考虑 以 下 情况 : 

a 优化 工作 进度 迟缓 ， 无 法 按时 完成 ， 

a 发 现 优化 工作 无 法 达到 预期 目标 ， 甚 至 可 能 引起 新 的 性 能 问题 ， 
a 数据 库 补 丁 无 法 正常 完成 ， 

a 数据 库 无 法 正常 工作 ， 

a Js PE BATE 

a 系统 硬件 发 生 故障 ; 

所 有 和 本 次 优化 相关 的 可 能 出 现 的 问题 , 都 应 该 根据 出 现 的 概率 和 危害 程度 制订 相关 的 应 急 
预案 。 对 于 危害 性 越 大 的 情况 ,应急 预 案 也 应 该 越 完备 。 千 万 不 可 有 侥幸 心理 。 我 参加 过 很 多 优 
化 项 目 ， 在 做 优化 实施 时 ， 回 退 的 比例 起 码 占 到 5% 左 右 。 有 时 候 由 于 时 间 很 紧急 ， 回 退还 是 不 
回 退 成 为 十 分 艰难 的 决策 。 我 曾经 看 到 过 优化 过 程 中 出 现 了 一 些 问题 ,在 选择 是 否 回 退 时 , 决策 
者 选择 了 不 回 退 ， 最 后 导致 第 二 天 上 午 系统 出 现 了 严重 的 性 能 问题 。 

3. 实施 优化 计划 

优化 计划 的 实施 一 般 来 说 会 安排 在 晚上 或 周末 进行 。 有些 优化 不 需要 停机 进行 ， 而 有 些 优 化 需 
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要 停止 或 者 重启 数据 库 ， 有 些 优化 需要 消耗 相当 长 的 时 间 〈 比 如 表 或 索引 存储 结构 重组 ) 。 

实施 优化 计划 前 , 需要 向 项 目 组 提出 申请 , 并 由 项 目 组 协助 安排 优化 时 间 。 在 完成 必要 的 备 
份 等 准备 工作 后 再 进行 实施 。 实施 过 程 中 需要 随时 对 进度 进行 审核 , 如 果 发 现实 际 的 进度 要 远 远 
慢 于 预案 的 进度 估算 ,甚至 可 能 发 生 无 法 在 规定 停机 时 间 内 完成 的 情况 , 就 需要 及 时 调整 方案 其 
至 及 时 停止 实施 ， 比 较 严 重 的 情况 还 需要 根据 应 急 预案 立即 恢复 。 
在 实施 优化 计划 时 ,最 好 整理 一 个 实施 检查 表 (checklist) ， 在 实施 工作 中 ,每 完成 一 个 步骤 
就 在 该 检查 表 上 进行 记录 。 当 要 执行 某 个 优化 步骤 时 , 先 检查 检查 表 上 的 其 他 相关 步骤 是 否 已 经 
完成 。 当 优化 工作 完成 时 ， 还 要 查看 检查 表 是 否 所 有 的 步骤 都 已 完成 。 

4. 优化 后 评估 

优化 方案 实施 后 ， 应 该 安排 DBA 对 数据 库 进行 24 小 时 一 72 小 时 的 实时 观察 (根据 系统 规 
模 不 同 ， 实 时 观察 的 时 间 长 短 也 不 同 )。 观 察 的 内 容 包括 系统 级 和 应 用 级 两 个 方面 ， 系 统 级 观察 
包括 : 

















系统 CPU 使 用 情况 ; 
系统 VO 情况 ， 
系统 内 存 情况 ; 
系统 网 络 状态 ; 
数据 库 总 体 负载 情况 ; 
数据 库 平 均 SQL 响应 时 间 ， 
关键 业务 SQL 的 执行 计划 ， 
数据 库 平均 事务 响应 时 间 ，; 
a 主要 等 待 事件 ; 
a 数据 库 IO 情况 。 

除了 观察 系统 状况 外 , 还 需要 对 应 用 系统 进行 观察 , 查看 相关 应 用 系统 总 体 的 工作 状态 是 否 
正常 。 在 这 里 要 强调 的 一 点 是 ， 优 化 实际 上 是 一 种 系统 变更 行为 ， 可 能 存在 一 些 不 确定 的 因素 。 
因此 ， 在 优化 实施 之 前 ， 应 该 将 对 系统 影响 较 大 的 SQL 以 及 关键 业务 的 主要 SQL 的 执行 状态 和 
执行 计划 都 采集 下 来 , 优化 完成 后 , 对 这 些 SQL 的 执行 情况 进行 比 对 。 如 果 发 现 优化 后 某 些 SQL 
的 平均 每 次 执行 开销 明显 大 于 优化 前 ， 那 么 就 需要 比 对 这 些 SQL 的 执行 计划 ， 找 出 故障 原因 ， 
否则 这 些 问 题 可 能 导致 第 二 天 出 现 灾难 性 的 后 果 。 

完成 优化 工作 后 , 需要 对 优化 的 系统 进行 评估 以 确定 优化 是 否 达到 目标 。 通 过 和 优化 前 采集 
的 数据 进行 比较 , 可 以 得 到 系统 总 体 性 能 提升 的 幅度 。 优 化 效果 评估 需要 严格 按照 优化 方案 中 的 
优化 目标 进行 。 如 果 某 个 项 目 没有 达到 预期 目标 , 需要 找到 原因 ， 并 确定 是 否 需要 进行 下 一 步 优 
化 。 

下 面 是 一 个 系统 优化 前 后 比较 的 例子 。 
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指标 名 旧 系 统 情况 当前 情况 变化 对 比 # if 
系统 CPU 30%~60% 60%~90% 比 以 前 加 大 30% CPU 使 用 率 明 显 提高 
系统 内 在 90% 90% 0% 变化 不 大 
系统 IO 等 待 40%~50% 0~30% 大 幅度 减少 目前 基本 处 于 正常 状态 
响应 时 间 11.47s 3.18s 加 快 3.37 倍 
事务 数 / 秒 3.51 9.38 提高 2 倍 多 





一 般 来 说 优化 不 是 一 次 就 能 够 完成 的 ， 上 述 过 程 需 





已 经 达到 才 停止 。 在 这 个 过 程 中 ,也 需要 对 优化 目标 进行 一 些 修正 ， 如 果 最 


进行 多 次 循环 , 直到 所 有 的 优化 目标 都 




















来 存在 风险 或 者 根本 无 法 达到 ， 那 么 就 需要 尽快 修正 优化 目标 。 


E 之 优化 小 技巧 ) 转 储 文件 内 容 1: 数据 文件 
x 转 储 数据 文件 、 重 做 日 志 等 文件 的 内 容 也 是 优化 中 经 常用 到 的 技术 ， 因 此 DBA 必须 掌握 。 





初 设 定 的 目标 实现 起 


在 优化 项 目 中 ， 有 时 候 为 了 分 析 表 和 索引 等 的 碎片 、 行 迁移 等 情况 ， 需 要 对 数据 文件 进行 转 储 。 


把 数据 库 文件 (数据 文件 、 日 志文 件 、 控 制 文件 等 ) 的 内 容 取出 有 助 于 对 Oracle 数据 库 内 部 结构 
展开 分 析 。 使 用 操作 系统 的 转 储 工具 可 以 导出 数据 库 文件 中 的 内 容 , 不 过 这 种 方式 相对 比较 麻烦 。 
Oracle 提供 的 ALTER SYSTEM DUMP 命令 就 可 以 把 数据 导出 到 Trace 文件 中 ， 这 一 命令 是 以 数 





据 块 为 单位 的 。 


对 于 普通 的 数据 文件 ， 通 过 下 面 的 命令 可 以 导出 数据 文件 中 的 数据 块 : 


ALTER SYSTEM DUMP DATAFILE [«file id»|«file name»] block «block no»; 


或 者 : 





ALTER SYSTEM DUMP DATAFILE [<file_id>|<file_name>] block min «block no min» block 





max «block no max»; 


第 一 条 命令 导出 一 个 数据 块 ， 第 二 条 命令 可 以 导出 多 个 连续 的 数据 块 。 以 上 命令 不 能 转 储 





LMT 的 临时 表 空 间 文 件 。 如 果 用 ALTER SYSTEM 
表 空 间 文 件 ， 会 报 ORA-1205 错误 ， 具 体 如 下 : 


DUMP 











DATAFILE 命令 去 导出 一 个 LMT 的 临时 


SQL> ALTER SYSTEM DUMP DATAFILE 'E:NORACLENORADATANORC9Nsk TEMP.DBF' BLOCK 1; 
ALTER SYSTEM DUMP DATAFILE 'E:\ORACLE\ORADATA\ORC9\sk_TEMP.DBF' BLOCK 1 


* 


ERROR at line 1: 





ORA-01205: not a data file - type number in header is 6 


查看 ORA-1205 的 错误 信息 : 


Text : not a datafile - type number in header is «num > 


Cause: The file type in the header is not correct for a datafile. 


This is probably a redo log file or control file. 


Action: Restore a copy of the correct datafile and perform recovery as needed. 


要 转 储 LMT 的 临时 文件 ， 需 要 使 用 DUMP TEMPFILE 命令 : 


SQL> ALTER SYSTEM DUMP TEMPFILE 'E:\ORACLE\ORADATA\ORC9\sk_TEMP.DBF' BLOCK 1; 





System altered. 
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今天 是 周 日 ， 没 有 安排 工作 。 到 沈阳 儿 天 了 , 一 直 都 很 忙碌 ,今天 难得 清闲 ， 所 以 我 一 个 人 
去 故宫 转 了 转 。 沈 阳 故 宫 是 沈阳 旅游 业 的 王牌 ， 它 是 满 清 入 关 前 最 后 的 皇宫 ,也 是 目前 保留 较为 
完整 的 、 仅 次 于 北京 故 言 的 宫殿 群 。 在 我 的 印象 里 ， 故 宫 是 一 个 值得 一 玩 的 地 方 ， 不 过 这 一 次 我 
看 到 的 却 是 满目 的 破败 ,完全 没有 了 我 小 时 候 游 故宫 的 样子 。 记 得 当年 还 写 过 一 篇 游 故 宫 的 作文 ， 
里 面 的 沈阳 故宫 是 金 下 辉煌 的 , 和 有 眼前 的 千 疮 百 筷 完全 对 不 上 号 。 故 宫 中 有 三 分 之 一 的 建筑 没有 
开放 ， 而 开放 的 建筑 也 大 多 数 破 败 不 堪 ， 甚 至 十 王 享有 儿 个 亭子 里 居然 堆放 着 水 泥 。 睹 物 思 情 ， 
想到 昔日 辉煌 的 呈 家 宫殿 落魄 到 如 此 田地 ， 不 免 有 些 伤 感 。 

晚上 约 了 7 个 哥们 儿 ， 都 是 老 张 的 同学 ， 我 和 老 张 同 校 但 不 同班 ， 他 们 和 我 比较 合 得 来 ,每 
次 回 沈 阳 ， 都 会 一 起 喝酒 。 照 例 是 在 “新 洪 记 ”啤酒 馆 ， 今 天 孙 大 夫 、 周 秘书 和 大 哥 都 来 了 ， 所 
以 气氛 也 比较 热烈 。 

孙 大 夫 是 外 科 医 生 , 这 要 在 深圳 属于 高 收入 人 群 了 , 但 是 由 于 他 不 愿意 同 流 合 污 ， 因此 日 子 
过 得 比较 清贫 ,但 是 他 很 满足 。 今 天 一 来 就 大 加 他 女儿 的 老师 ， 居然 公开 向 他 要 红包 ,被 他 严词 
拒绝 了 。 大 家 都 说 他 太 迁 , 劝 他 不 要 太 认真 7, 为 了 这 种 事情 和 老师 较劲 , 最 后 吃亏 的 是 他 女儿 。 
大 家 说 了 一 大 通 , 还 是 没 能 说 服 人 他。 按照 孙 大 夫 的 意思 ， 如 果 大 家 都 去 同 流 合 污 ， 那么 社会 风气 
永远 也 好 不 了 ， 他 哪怕 做 出 点 辆 牲 ， 也 要 给 大 家 开 个 头 。 对 于 孙 大 夫 的 勇气 ,大 家 向 来 是 比较 钦 
佩 的 ， 于 是 大 家 嘻嘻哈哈 的 ， 又 猛 灌 了 孙 大 夫 几 杯 。 

周 秘书 是 市 领导 的 秘书 , 平时 也 比较 忙 , 不 过 我 和 老 张 都 回 沈阳 了 , 再 忙 也 要 出 来 舍命 陪 君 
子 。 长 期 跟 领 导出 去 ,为 领导 遮 风挡 雨 ， 练 就 了 一 身 好 酒量 。 而 且 周 秘书 知道 的 掌故 颇 多 ， 每 次 
聚会 都 会 摆 龙 门 阵 ， 因 此 有 有 周 秘书 在 场 ， 大 家 起 码 也 能 多 喝 两 瓶 。 

今 晚 大 家 都 没什么 事 ， 所 以 喝 得 比较 放松 ， 一 大 桌子 菜 没 怎么 动 , 大 家 都 已 着 频频 举 杯 。 沈 
阳 人 喝酒 很 豪迈 ， 在 广东 一 个 人 能 喝 一 两 瓶 啤酒 就 算 可 以 了 ， 而 在 沈阳 喝酒 都 是 按 箱 算 的 。 有 
次 过 年 , 我 刚 买 好 了 一 箱 啤酒 , 准备 过 年 喝 。 来 了 一 个 同学 , 中 午 两 个 人 就 着 我 妈 做 的 凉菜 喝酒 ， 
我 那个 哥们 把 我 这 一 箱 啤 酒 全 部 干掉 ， 还 没 喝 过 疗 。 这 次 这 顿 酒 从 晚上 6 点 多 开始 ,一直 喝 到 快 
12:00 了 ， 大 家 才 算 酒 足 饭 饱 。 一 共 喝 了 6 箱 啤 酒 ， 平 时 不 太 喝 酒 的 我 分 天 也 喝 了 四 五 瓶 。 

买 完 单 出 来 ， 周 秘书 看 样子 还 没 尽兴 ， 问 还 要 搞 什么 活动 不 ， 大 可 说 算 了 ， 明 天 还 要 上 班 ， 
大 家 就 各 回 各 家 吧 。 我 和 周 秘书 、 孙 大 夫 同 路 , 就 一 起 打 了 个 车 。 大 家 喝 的 都 有 点 多 了 ， 上 车 后 ， 
周 秘书 习惯 性 地 坐 在 前 排 , 我 和 孙 大 夫 坐 在 后 排 , 我 们 两 正在 聊 女 儿 上 学 的 事情 ,突然 周 秘书 把 
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手机 递 给 我 ， 说 :“ 老 白 ， 有 熟人 找 你 说 话 。 我 一 接 电话 ， 老 洪 那 狼 有 的 声音 就 传 了 过 来 :“ 老 
白 ， 你 也 太 不 够 意思 了 ， 到 了 沈阳 都 不 给 老 哥 我 打 个 招呼 ， 麻 汐 的 ， 到 我 家 边 上 的 北京 羊 蝎子 ， 
我 先 过 去 等 你 们 ， 周 秘书 知道 那 地 方 。 

老 洪 是 我 的 学 长 ， 大 学 毕业 后 早 就 放弃 了 技术 老 本 行 , 进入 仕途 ， 而 且 走 得 一 直 很 顺 ， 三 十 
出 头 就 高 居 处 座 ， 目 前 在 沈阳 做 正 处 级 办 公 室 主任 。 老 洪 为 人 比较 豪 夹 ， 给 人 大 大 呵 史 的 感觉 ， 
而 实际 上 做 事 滴水 不 漏 ， 是 个 当 定 的 好 料 子 。 我 们 赶 到 北京 羊 蝎 子 时 ， 老 洪 已 经 叫 了 一 个 羊 蝎 子 
火锅 ， 几 样 小 菜 ， 自 己 坐 在 那里 喝 呢 。 这 里 只 要 要 一 个 羊 蝎子 火锅 ， 啤 酒 一 律 免费 ， 能 喝 多 少 就 
送 多 少 。 

老 洪 见 到 我 们 ， 没 再 提 我 到 沈阳 没 打招呼 的 事情 ， 说 :“ 哥 几 个 看 样子 还 没 喝 高 ， 这 里 再 喝 
点 ， 啤 酒 免费 随便 喝 ， 咱 们 今天 几 个 哥们 儿 会 会 ， 也 别 讲究 地 方 了 ， 就 是 啤酒 差点 ， 哈 啤 ， 口 感 
还 可 以 。” 周 秘书 和 和 孙 大 夫 酒 量 还 可 以 ， 我 今天 已 经 算是 超 水 平 发 挥 了 ， 所 以 酒 喝 得 有 点 费劲 ， 
好 在 老 洪 酒 德 不 错 ， 又 有 和 孙 大 夫 带 头 冲锋 陷 阵 ,一 场 酒 下 来 ,我 又 喝 了 差不多 两 瓶 哈 啤 。 要 在 以 
往 ， 喝 上 3 瓶 啤酒 ， 我 也 就 只 有 找 个 地 方 睡觉 的 份 了 ， 今 天 加 在 一 起 ， 喝 了 差不多 OLS, A 
还 没 倒 下 ， 算 是 个 奇迹 了 。 看 样子 喝酒 也 要 看 场合 和 心情 ， 老 朋友 见面 ， 心 情 愉快 ， 连 酒量 都 长 
了 。 

已 经 下 半夜 3 点 多 了 ， 应 该 好 好 睡 个 觉 了 ， 下 周 将 是 十 分 艰苦 的 一 周 。 


E 人 优化 帆 技巧 ) 系统 级 优化 


系统 级 优化 是 相对 于 应 用 级 优化 的 另 一 种 优化 方式 。 系统 级 优化 是 在 尽量 不 修改 应 用 的 基础 
上 实现 对 数据 库 的 优化 ， 一 般 通 过 以 下 手段 来 实现 : 
a 调整 操作 系统 参数 ， 
a 调整 数据 库 参 数 ， 
a 进行 VO 负载 均衡 处 理 ， 

系统 级 优化 往往 是 针对 应 用 的 情况 调整 系统 资源 配置 , 使 应 用 系统 能 够 在 一 种 优化 的 资源 
配置 下 运行 ， 从 而 达到 优化 的 目的 。 由 于 不 需要 深入 了 解 应 用 系统 的 细节 ， 因 此 系统 级 优化 的 
实施 相对 比较 容易 。 也 正 是 因为 系统 级 优化 不 需要 了 解 应 用 系统 的 细节 ， 所 以 系统 级 优化 的 成 
功率 相对 较 低 。 如 果 在 进行 系统 级 优化 时 ， 能 够 更 多 地 了 解 应 用 系统 ， 就 可 以 提高 系统 级 优化 
的 成 功率 。 

系统 级 优化 的 重点 是 找到 系统 的 瓶颈 。 使 用 STATSPACK 报告 是 检查 系统 瓶颈 的 重要 手段 ， 
因此 进行 系统 级 优化 可 以 按照 如 下 步骤 进行 系统 分 析 : 

(1) 进行 STATSPACK 分 析 ， 也 可 以 辅 以 OEM 的 系统 健康 性 报告 ; 
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(2) 通过 STATSPACK 报告 找到 目前 系统 中 超出 常规 标准 的 所 有 情况 ， 

(3) 分析 这 些 情况 ， 并 通过 辅助 检查 ， 找 出 系统 的 主要 瓶颈 ， 

(4) 根据 分 析 结 果 ， 确 定 系统 参数 的 调整 方案 。 

由 于 系统 级 优化 方式 优化 成 本 相对 较 小 , 所 以 当 数 据 库 出 现 性 能 问题 时 , 如 果 应 用 软件 修改 
的 成 本 比较 高 ， 而 且 进 行 系 统 级 优化 就 能 够 达到 目的 ， 那 么 系统 级 优化 应 该 是 首选 方案 。 
在 系统 级 优化 时 很 容易 形成 的 误区 是 片面 强调 某 一 个 方面 的 优化 。 以 前 有 个 DBA 问 过 我 ， 
有 什么 办 法 能 快速 让 CPU 使 用 率 下 降 。 我 说 有 个 最 简单 的 方法 , 那 就 是 让 VO 的 性 能 降低 . CPU, 
AE. VO 资源 是 一 个 铁 三 角 ， 互 相 之 间 会 产生 互动 。 做 系统 级 优化 ， 如 果 把 VO 优化 到 极致 是 
不 是 就 是 最 好 的 呢 ? 在 某 些 情况 下 ， 可 能 不 是 ， 比 如 在 一 个 CPU 资源 十 分 紧张 的 系统 下 ， 提 升 
VO 性 能 可 能 会 造成 更 多 的 CPU 开销 。 另 外 ， 由 于 我 们 的 系统 不 是 一 个 封 困 的 应 用 ， 或 多 或 少 存 
在 一 定 的 排队 效应 ， 一 旦 应 用 的 性 能 有 一 点 点 提升 ， 就 可 能 导致 更 多 的 事务 请 和 系统， 导致 系统 
负载 上 升 ，CPU 的 资源 消耗 更 为 严重 ， 当 CPU 出 现 了 瓶颈 的 时 候 ， 可 能 优化 后 的 系统 整体 性 能 
不 会 提升 ， 反 而 会 下 降 。 因 此 ， 在 做 系统 级 优化 时 ， 一 定 要 注意 ，CPU、 内 存 、LIO 三 个 资源 都 
不 应 该 出 现 短 板 ， 否 则 就 需要 通过 调整 来 达到 平衡 。 也 就 是 一 些 DBA 经 常 说 的 用 CPU f$ VO, 
用 内 存 换 IO 等 。 

用 内 存 换 IO 其 实 很 简单 。 如 果 内 存 空闲 较 大 ， 而 IO 压力 很 大 ， 通 过 加 大 DB Cache 等 就 
可 以 减少 VO 的 开销 。 不过， 加 大 DB Cache 在 增加 内 存 使 用 、 减 少 VO 开销 的 同时 ， 也 会 增加 
CPU 的 使 用 。 通 过 上 面 的 例子 ， 大 家 需要 记 住 一 个 原则 ， 就 是 系统 优化 的 要 点 是 平衡 。 


PSREN) 转 储 文件 内 容 2， 转 储 对 象 的 段 头 


在 Oracle H, 每 个 段 都 包含 一 个 段 头 。 段 头 一 般 来 说 是 某 个 段 第 一 个 扩展 的 第 一 个 块 ， 包含 
段 的 信息 〈 段 的 扩展 情况 、FREE LIST 的 数量 等 )。 要 转 储 段 头 的 信息 ， 首 先 需要 定位 某 个 段 的 
段 头 所 在 的 位 置 。 通 过 下 面 的 查询 可 以 查看 到 段 头 的 相关 信息 : 


SELECT SEGMENT NAME, HEADER FILE, HEADER BLOCK 
FROM DBA SEGMENTS 
WHERE OWNER = '«SEGMENT OWNER>' AND SEGMENT NAME = '«SEGMENT NAME ' ; 


比如 : 
































SELECT SEGMENT NAME, HEADER FILE, HEADER BLOCK 
FROM DBA SEGMENTS 


WHERE OWNER - 'SCOTT' AND SEGMENT NAME - 'EMP'; 
SEGMENT NAME HEADER FILE HEADER BLOCK 
EMP 8 7411 


这 个 例子 说 明 EMP 的 段 头 在 8 号 文件 的 7411 数据 块 。 使 用 下 面 的 命令 ， 可 以 把 段 头 转 储 出 


ALTER SYSTEM DUMP DATAFILE 8 BLOCK 7411; 
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产生 的 Trace 文件 会 存放 在 USER_DUMP_DEST 参数 指定 的 位 置 ， 如果 没 有 设置 这 个 参 
么 默认 的 位 置 是 $Oracle BASE/admin/<sid>/udump。 如 果 要 转 储 回 退 段 ， 那 么 可 以 这 样 操作 : 


SELECT SEGMENT NAME, HEADER FILE, HEADER BLOCK 
FROM DBA SEGMENTS 














WHERE SEGMENT NAME = 'RBSO1'; 
SEGMENT NAME HEADER FILE HEADER BLOCK 
RBS01 2 514 


alter system dump datafile 2 block 514; 
或 者 直接 用 下 面 的 命令 转 储 : 


ALTER SYSTEM DUMP UNDO HEADER RBS01; 
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5 月 15 日 A 业务 支撑 系统 出 问题 了 





今天 是 正式 进入 工作 状态 的 一 周 的 开始 , 上 一 周 事务 性 的 东西 大 多, 因此 只 是 对 本 次 优化 工 
作 形 成 了 一 个 初步 的 想法 。 本 周 的 工作 很 多 , 除了 要 完成 《系统 性 能 评估 报告 》 外 , 还 要 完成 《 系 
统 性 能 分 析 报 告 》 和 《系统 性 能 评估 指标 手册 》， 这 是 我 们 这 个 项 目 向 客户 提交 的 第 一 部 分 技术 
性 报告 。 报 告 的 内 容 可 能 会 作为 评价 我 们 本 次 优化 工作 的 基础 ， 因 此 需要 十 分 细致 。 我 和 老 于 决 
定 分 工 完 成 ， 我 负责 完成 《系统 性 能 分 析 报 告 》。 

我 的 计划 是 按部就班 一 步 一 步 来 ， 先 进行 性 能 分 析 ， 确 定 优化 的 最 佳 路 径 ， 然 后 提出 正式 的 
优化 方案 ,优化 方案 必须 经 过 评审 ,评审 后 的 优化 方案 需要 甲 方 、 集 成 商 和 我 们 三 方 签字 ,然后 
三 方 根据 优化 方案 共同 制订 实施 计划 。 这 也 是 我 一 贯 的 工作 方式 , 但 是 实际 上 很 多 项 目 根本 无 法 
按照 预先 设想 的 完整 流程 进行 , 就 像 这 个 项 目 。 对 于 这 个 病 入 请 盲 的 系统 , 有 时 候 就 像 救火 一 样 ， 
只 能 是 该 出 手 时 就 出 手 了 。 不 过 从 整个 项 目的 优化 效果 来 考虑 , 我 还 是 希望 这 种 救火 的 事情 能 够 
越 迟 发 生 越 好 。 

今天 下 午 突然 爆发 了 BSS 系统 的 性 能 问题 ， 最 初 我 们 认为 性 能 问题 最 严重 的 是 销 账 系统 ， 
BSS 系统 各 方面 指标 还 可 以 ,这 个 突 发 事件 完全 颠覆 了 我 的 初步 印象 。 今 天 下 午 开发 商 的 应 用 维 
护 人 员 小 孙 突 然 接 到 很 多 营业 厅 的 申告 ,说 BSS 系统 性 能 十 分 差 ， 营 业 前 台 出 现 了 大 面积 的 排 
队 ,希望 我 们 能 够 尽快 协助 处 理 一 下 。 对 于 Oracle 9i 的 数据 库 , 我 十 分 喜欢 使 用 OEM Performance 
Manager 进行 实时 监控 ， 并 在 每 套数 据 库 上 安装 STATSPACK, Aa) T 30 分 钟 自动 采样 。 在 做 系 
统 性 能 优化 时 ， 我 一 般 都 会 要 求 客 户 开 启 自动 STATSPACK 采样 ， 有 条 件 的 就 开启 30 分 钟 采样 ， 
否则 采用 1 小 时 自动 采样 。 如 果 采 用 30 分 钟 间 隔 的 STATSPACK 自动 采样 ， 一 旦 发 现 系统 存在 
异常 ， 马 上 做 一 个 采样 点 ， 基 本 上 就 可 以 抓 住 系统 存在 的 主要 问题 。 抓 系统 的 问题 ，10 一 15 分 
钟 的 STATSPACK 报告 是 十 分 有 效 的 。 如 果 开 了 30 分 钟 自动 采样 ， 那 么 我 们 只 要 临时 生成 一 个 
采样 点 ， 就 能 够 获得 一 份 故障 发 生 期 间 少 于 15 分 钟 采样 周期 的 报告 。 

当 小 孙 告 诉 我 们 BSS 系统 存在 严重 问题 时 , 我 们 马上 通过 OEM Performance Manager 的 系统 
健康 性 图 表 发 现 系统 的 负载 比较 高 。 根据 生成 的 STATSPACK 报告 , 将 其 和 昨天 的 结果 进行 比 对 ， 
发 现今 天 的 系统 负载 比 平时 高 出 30% 左 右 。 通 过 OSWATCH 的 监控 数据 发 现 ，CPU 或 IO 都 出 
现 了 较为 严重 的 问题 。 

我 让 小 孙 找 了 一 个 营业 厅 , 咨 询 一 下 今天 业务 量 比 平时 高 出 这 么 多 , 是 不 是 有 什么 特殊 业务 。 
营业 厅 那 边 的 反馈 是 没有 听 说 有 什么 特殊 业务 , EKRE, 这 是 一 个 错误 的 信息 ， 由 于 这 个 错误 信 
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息 ， 让 我 们 走 了 很 多 弯路 ,业务 量 有 所 增长 这 个 信息 直接 被 我 们 忽略 了 ， 我 们 把 分 析 的 重点 放 在 
了 查找 是 否 存在 某 些 SQL 走 错 了 执行 计划 以 及 是 不 是 碰 到 了 什么 bug 上 。 经 过 一 个 多 小 时 的 分 
析 ， 我 们 并 没有 发 现 核 心 业务 的 SQL 出 现 执 行 计划 错误 ， 警 告 日 志 中 也 没有 发 现 明显 的 问题 ， 
于 是 我 再 次 确定 肯定 是 存在 什么 特殊 业务 , 否则 不 可 能 出 现 这 种 情况 。 能 够 确定 这 一 点 是 因为 昨 
天 我 们 也 采集 了 STATSPACK 报告 , 通过 和 昨天 的 STATSPACK 报告 相 比 ， 我 们 发 现今 天 排 在 前 
儿 位 的 SQL 是 平时 在 Top SQL 中 看 不 到 的 。 无 论 是 按照 缓冲 区 获取 排序 还 是 按照 物理 读 排序 ， 
排 在 前 面 的 几 个 SQL 都 占 了 整个 系统 的 30% 以 上 ， 而 这 几 个 SQL 在 最 近 一 个 月 的 STATSPACK 
报告 中 都 看 不 到 。 通 过 这 样 比 对 ， 我 和 老 于 都 觉得 这 些 SQL 肯定 是 今天 才 冒 出 来 的 ， 今 天 肯定 
有 什么 特殊 的 新 业务 ， 或 者 某 种 业务 今天 特别 忙 。 再 次 和 客户 确认 后 ,终于 找到 了 答案 ,这 几 天 
的 刊 刮 卡 业务 十 分 火爆 ,业务 量 差不多 是 平时 的 S 倍 以 上 。 了 听 到 这 个 销 息 ， 我 立即 让 小 孙 把 这 几 
个 SQL 发 给 负责 刊 刮 卡 业 务 的 开发 人 员 ， 让 他 们 看 看 这 几 个 SQL 是 不 是 刊 刮 卡 业 务 的 。 小 孙 通 
过 BQQ 把 SQL 发 过 去 ， 那 边 立即 很 肯定 地 说 这 几 个 SQL 就 是 刊 刊 卡 业务 的 。 

我 们 研究 了 一 下 这 几 个 SQL SUR H JLA SQL 都 是 对 一 张 300 万 记录 的 表 做 全 表 扫 描 ， 而 
从 SQL 来 看 ， 每 次 返回 的 记录 只 有 几 条 ， 这 种 情况 下 ， 完 全 是 可 以 通过 索引 来 访 癌 的。 添加 了 
一 个 复合 索引 后 ， 这 儿 个 Top SQL 的 性 能 有 了 明显 改善 ，SQL 的 成 本 下 降 了 99%， 过 了 几 分 钟 ， 
CPU 也 出 现 了 久违 的 IDLE， 系 统 性 能 得 到 了 明显 的 改善 。 
在 调整 索引 的 过 程 中 ， 我 发 现 这 几 张 相关 的 表 上 有 很 多 索引 ， 但 都 是 单列 索引 ， 由 于 这 些 
SQL 的 WHERE 条 件 涉及 多 个 列 ， 因 此 很 多 SQL 都 是 通过 几 个 单列 索引 扫描 ， 然 后 取 交 集 ， 这 样 
的 索引 效率 就 相对 较 低 。 

经 过 儿 层 协调 ,我 终于 找到 了 开发 这 个 模块 的 开发 人 员 , 我 询问 他 为 什么 要 设计 这 样 的 索引 ， 
而 不 使 用 复合 索引 。 开 发 人 员 的 回答 让 我 感到 震惊 ， 他 说 :“ 我 不 知道 什么 叫 复合 索引 ， 我 为 每 
个 字段 都 建 了 索引 ，Oracle 就 应 该 能 用 到 索引 了 。” 从 他 的 回答 上 我 感到 他 根本 不 理解 索引 的 概 
念 ， 黄 至 很 可 能 这 个 项 目的 整个 开发 团队 都 对 索引 知之 期 少 ,因此 他 们 设计 出 来 的 索引 可 能 都 存 
在 很 严重 的 问题 ， 今 天 暴露 出 来 的 问题 只 是 冰山 一 角 。 

我 和 老 肖 讨论 了 这 个 问题 ,决定 马上 对 BSS 系统 的 索引 进行 监控 , 看 看 这 个 系统 中 的 近 2000 
个 索引 ， 到 底 哪 些 用 到 了 ， 哪 些 根本 没有 用 到 。 在 下 一 步 的 SQL 优化 工作 中 ， 索 引 优化 将 成 为 
一 个 重点 。 老 肖 主 动 承 担 了 这 个 任务 ， 对 BSS 系统 的 所 有 常用 表 进行 一 次 索引 分 析 。 方 法 是 使 
用 STATSPACK 和 SQLA 将 主要 的 SQL 语句 根据 缓冲 区 获取 和 物理 读 两 种 情况 进行 排序 ， 对 排 
在 前 30 位 的 所 有 SQL 进行 检查 ， 看 看 执行 计划 是 否 异 常 ， 如 果 发 现存 在 明显 索引 扫描 不 合理 的 
SQL， 就 将 它 列 出 来 ， 交 给 我 进行 进一步 分 析 。 为 了 配合 SQL 分 析 ， 我 建议 吧 STATSPACK 的 
Snap Level 设置 为 6 级 ,这样 在 STATSPACK 采集 的 数据 中 就 会 包含 SQL 的 执行 计划 ， 可 以 方便 
我 们 对 SQL 进行 分 析 。 

我 和 老 肖 把 STATSPACK Snap Level 调整 到 6 级 的 想法 和 老 于 商量 了 一 下 , 老 于 怕 提 高 Snap 
Level 会 增加 系统 开销 ， 加 重 CPU 的 压力 。 我 觉得 每 30 分 钟 采集 一 次 Snap， 目 前 每 次 采集 Snap 
大 概 是 20s ~ 30s, 4A Snap Level 提高 到 6 级 ， 估 计 也 会 在 1 分 钟 左右 完成 ， 对 系统 的 影响 不 会 
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KK. RK BSS 系统 在 平时 的 CPU 负载 并 不 是 特别 高 ， 只 是 今天 爆发 比较 明显 ， 只 要 我 们 在 25 
日 业务 高 峰 前 把 Snap Level 调整 回来 ， 应 该 对 系统 不 会 有 多 少 影响 。 三 个 人 一 讨论 ， 老 于 觉得 我 
说 的 也 在 理 ， 就 同意 了 我 的 想法 。 

回 到 办 公 室 ， 老 肖 通 过 执行 一 次 STATSPACK Snap 采样 把 Snap Level 设置 为 6: 

Sql>exec statspack.Snap(i_snap_level=>6,i modify parameter-»'TRUE'); 

为 了 方便 Top SQL 的 提取 ， 我 建议 老 肖 修 改 STATSPACK 的 相关 脚本 。 把 ?/rdbms/admin/sp- 
repins.sql 中 的 define top n sql = 5 修改 为 define top n sql = 50, 这样 我 们 就 可 以 获 
得 Top 50 的 SQL 了 。 

我 和 老 肖 正在 讨论 ， 看 见 小 孙 背 着 电脑 走 了 过 来 :“ 老 白 ， 还 不 下 班 ,都 6 点 多 了 。” 不 知 不 
觉 一 个 下 午 又 过 去 了 ， 由 于 下 午 这 个 故障 , 今天 该 做 的 事情 还 有 好 多 没 做 完 ， 只 能 带 回 酒店 加 班 
了 。 我 和 老 肖 整 理 好 电脑 ， 发 现 老 于 不 在 办 公 室 里 ， 老 肖 说 老 于 肯定 在 门口 抽烟 呢 。 出 门 一 看 ， 
老 于 一 个 人 确实 坐 在 那里 喷 云 吐 雾 呢 。 我 走 过 去 说 :“ 老 于 该 下 班 了 ， 走 吧 。” 老 于 好 像 被 我 惊 了 
一 下 ， 抬 起 头 看 见 我 和 老 肖 ， 做 了 一 个 坐 下 的 手势 。 

我 和 老 肖 找 了 两 把 椅子 坐 下 来 ， 老 于 才 慢 悠悠 地 说 :“ 刚 才 孙 主任 又 来 电话 问 我 们 能 不 能 调 
整 一 下 策略 ， 先 搞 几 个 动作 ， 让 他 们 减轻 点 压力 。 

我 一 昕 这 个 马上 就 急 了 :“ 老 于 ， 你 可 千 万 别 答应 啊 ， 现 在 我 们 两 眼 一 抹黑 ， 这 个 时 候 做 调 
整 不 是 找 死 吗 ? 当年 海尔 的 系统 那个 样子 了 , 我 也 没有 立即 动手 , 起 码 也 是 分 析 了 一 个 多 星期 才 
做 的 第 一 次 调整 。 

老 于 说 :“ 老 白 ， 你 先 别 急 ， 我 刚才 也 没 敢 答应 ， 因 为 这 是 优化 项 目的 大 辟 。 不 过 今天 下 午 
南 塔 的 一 个 营业 厅 由 于 系统 比较 慢 ， 有 个 顾客 和 营业 员 产 生 了 争执, 把 营业 员 都 搞活 了 。 现在 孙 
主任 他 们 压力 很 大 ， 我 都 不 知道 该 怎么 拒绝 他 。” 

看 样子 老 于 有 点 心动 了 ， 我 抽出 一 支 烟 点 上 , 猛 抽 了 几 口 ， 想 让 自己 冷静 一 下 。 这 个 口子 可 
千 万 别 开 ， 否 则 我 们 的 优化 计划 就 全 泡汤 了 。 

三 个 人 讨论 了 半天 ， 也 没有 讨论 出 个 子 丑 寅 卯 来 。 最 后 我 和 老 于 说 :“ 算 了 ， 这 件 事 我 们 也 
别 表态 了 ， 就 拖 着 吧 ， 能 拖 到 什么 时 候 就 到 什么 时 候 ， 实 在 不 行 ， 第 一 次 调整 的 时 间 稍 微 提 前 一 
点 ， 但 是 现在 绝对 不 是 动手 的 好 时 机 。” 
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今天 BSS 系统 出 现 的 故障 是 十 分 典型 的 ， 故 障 排查 的 过 程 在 今天 的 日 记 中 写 得 相当 详细 。 
期 间 我 们 犯 了 一 个 错误 ， 我 们 问 小 孙 今 天 有 没有 什么 特殊 业务 ， 他 说 没有 。 其 实 我 们 不 应 该 这 
么 轻信 别人 的 话 ， 而 应 该 更 加 相信 我 们 所 看 到 的 ， 从 STATSPACK 报告 上 我 们 可 以 明显 看 到 排 
在 前 儿 位 的 那 几 个 SQL 是 造成 今天 问题 的 元 多, 那么 我 们 应 该 马上 把 这 几 个 SQL 交 给 小 孙 , LE 
他 确认 这 几 个 SQL 是 哪个 模块 产生 的 ， 另 外 , 应 该 马上 检查 一 下 这 几 个 SQL 的 执行 计划 。 如 果 
做 这 些 检查 ， 我 们 很 快 就 可 以 发 现 ， 这 几 个 SQL 走 了 全 表 扫 描 ， 那 么 想 办 法 通过 索引 去 优化 就 
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可 以 了 。 

很 多 DBA 更 为 重视 技术 ， 而 往往 忽略 了 方法 。 其 实在 很 多 优化 项 目 里 ， 方 法 的 正确 性 远 比 
技术 的 正确 性 更 为 重要 。 正 确 的 方法 可 以 保证 在 分 析 过 程 中 少 走 弯路 。 今 天 的 案例 如 果 最 初 就 采 
用 了 正确 的 方法 ， 就 可 能 提前 解决 问题 ， 不 至 于 浪费 这 么 多 时 间 了 。 


E offien) 索引 监控 

”从 Oracle 9i 开始， 可 以 监控 Oracle 索引 的 使 用 情况 ， 具 体 方法 如 下 : 
ALTER INDEX <schema>.<index> MONITORING USAGE; 
对 革 个 索引 开启 监控 后 ， 就 可 以 观察 该 索引 是 否 被 使 用 


SELECT index name,monitoring,used,start monitoring,end monitoring 
FROM v$object usage; 
INDEX NAME MONITORING USED START MONITORING END MONITORING 





AA NO YES 06/04/2006 12:02:38 06/05/2006 13:47:39 
AA1 NO YES 06/04/2006 12:02:40 06/05/2006 13:47:39 


要 注意 的 是 ， 由 于 v$object usage 视图 限制 了 只 显示 当前 用 户 下 被 监控 的 索引 的 情况 ， 
所 以 通过 其 他 用 户 登 录 数 据 库 将 无 法 看 到 。 如 果 要 查看 所 有 用 户 下 被 监控 的 索引 的 情况 ,可 使 用 




















如 下 SQL: 
SELECT u.name owner, io.name index name, t.name table name, 
decode(bitand(i.flags, 65536), 0, 'NO', 'YES') monitoring, 
decode(bitand(ou.flags, 1), 0, 'NO', 'YES') used, 


ou.sStart monitoring start monitoring, 

ou.end monitoring end monitoring 

FROM sys.user$ u, sys.obj$ io, sys.obj$ t, sys.ind$ i, sys.object usage ou 
WHERE i.obj# = ou.obj# 

AND io.obj# = ou.obj# 

AND t.obj# = i.bo# 

AND u.user# = io.owner# 


如 果 要 取消 对 索引 使 用 情况 的 监控 ， 可 使 用 下 列 SQL: 

ALTER index <schema>.<index> NOMONITORING USAGE; 

要 注意 的 是 ,索引 使 用 情况 监控 会 增加 部 分 系统 开销 ,不 过 这 部 分 开销 基本 上 可 以 忽略 不 计 ， 
只 是 分 析 结 束 后 一 定 要 注意 关闭 监控 。 

另外 要 注意 的 是 , v$object usage 视图 是 和 登录 用 户 关联 的 , 从 这 里 只 能 看 到 本 用 户 相 关 
的 索引 的 使 用 情况 ， 如 果 通 过 sys 登录 进去 ， 那 么 无 法 看 到 其 他 模式 下 索引 的 使 用 情况 。 


E 人 优化 小 技巧 ) 性 能 优化 时 常用 的 工具 


”俗话 说 ， 工 签 善 其 事 ， 必 先 利 其 器 。 优 化 工具 对 优化 项 目 来 说 也 是 十 分 关键 的 。 很 多 DBA 
都 在 寻找 好 的 第 三 方 工具 , 实际 上 Oracle 自 带 的 工具 也 十 分 有 效 。 在 做 优化 项 目 时 ,我们 喜欢 使 
用 的 三 件 套 OEM, STATSPACK, OSWATCH 都 是 Oracle 的 工具 。 对 于 Oracle 10g, 可 以 使 用 EM, 
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ADDM, AWR/ASH fil OSWATCH, 

Oracle 9i J OEM 是 一 个 十 分 棒 的 工具 ， 可 能 很 多 DBA 都 用 过 OEM， 但 有 些 人 用 过 之 后 可 
能 觉得 OEM 没什么 特别 的 ， 这 是 因为 很 少 有 人 认真 用 过 。OEM 9i 的 Performance Manager, SQL 
Analyzer 等 工具 都 十 分 优秀 。Performance Manager 中 包含 了 上 百 个 图 表 ,， 通过 这 些 图 表 ， 可 以 很 
清晰 地 观察 到 数据 库 的 各 种 状态 。 


[Í Oracle Performance IT SYSMAN@jacksonxu 
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网络 


ORACLE 
中 国 并 和 管理 器 | Performance Manager 
| quer | 


OB, ORA92- SYS AS SYSDBA | | 
oa | Oracle Performance Manager 使 
PETLER ] Scene ees ARAS 
中 国 用 户 定义 的 图 表 Í HU Oracle 数据 库 服 务 器 、 
ll REBEL, | Rdb 数据 库 服务 器 和 操作 系统 的 
ob ME tyga] | 性 能 统计 信息 。 


— f 。 管理 员 可 以 将 这 些 数据 显示 为 不 


eub 顶层 会 话 M 。 同 的 图 表格 式 ， 包 括 饼 图 、 条 形 
je B 图、 带 状 图 (线形 图 ) 和 表 。 


€ 
& 
lj) 
T 
ht 
jj 
? 


TES | š 
Tria WS TRAX Performance | 

ili uo | Manager 的 详细 信息 ， 请 单 击 速 
jue > 


T 

«ple eit 

we Reife 
e» 

oy PST 


oye HERES | 
由 此 并 行 查询 | 





Ele Ao 统计 信息 
WE RRA SAY AQ 队列 
outro ARS SB = 








一 般 来 说 ， 启 动 性 能 概览 图 表 ， 就 可 以 看 到 整个 数据 库 的 基本 状态 。 

在 性 能 概览 图 表 中 , 最 上 面 的 是 OS 相关 情况 , 包括 CPU 使 用 率 、 内存 使 用 情况 和 1O 情况 。 
中 间 部 分 包含 数据 库 CPU 活动 、 数 据 库 内 存 、 数据 库 VO 活动 三 个 部 分 的 监控 内 容 , 包含 了 SGA 
各 个 缓冲 的 情况 , redo、dbwriter 等 的 情况 。 再 下 面 是 会 话 情况 , 可 以 查看 到 各 种 视角 下 的 Top 会 
话 。 最 底下 是 系统 等 待 事件 。 

在 OEM 中 ， 有 一 个 十 分 好 的 功能 是 下 钻 分 析 功能 ， 如 下 图 所 示 。 

在 很 多 地 方 可 以 通过 右键 选择 “下 钻 ”, 进行 深入 的 分 析 。 比 如 我 们 发 现 当 时 系统 等 待 db file 
scattered read 等 待 比 较 多 , 那么 可 以 通过 下 外 查看 哪些 SQL 引起 了 这 个 等 待 , 哪些 会 话 引 起 了 这 
个 等 待 。 

Performance Manager 还 有 一 个 不 错 的 功能 ,， 那 就 是 录像 功能 。 录 像 可 以 回放 ,这 个 功能 是 十 
分 有 用 的 。 对 于 Oracle 10g 的 数据 库 , 我 们 可 以 使 用 ASH 来 实现 类 似 的 功能 , 但 是 对 于 没有 ASH 
功能 的 Oracle 9i 数 据 库 来 说 ， 这 个 功能 可 以 帮助 DBA 解决 大 问题 。 有 一 次 一 个 客户 打 电 话 给 我 
说 系统 性 能 有 问题 ， 赶 到 现场 需要 30 分 钟 ， 而 这 个 问题 出 现 的 时 间 大 约 是 5~10 分 钟 ， 所 以 比 
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较 难 捕捉 。 我 接 到 电话 后 让 他 们 做 了 两 件 事情 : 一 是 马上 做 一 个 STATSPACK 的 Snap, 二 是 启动 
OEM 的 几 个 监控 视图 , 并 且 进 行 录像 。 我 到 达 现 场 后 , 根据 OEM 的 录像 回放 , 很 快 定位 到 主要 
的 等 待 事 件 的 情况 ， 并 且 从 STATSPACK 报告 中 得 到 了 印证 。 这 个 困扰 了 客户 很 久 的 问题 ， 在 这 
两 个 工具 的 帮助 下 很 容易 就 定位 了 。 
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OSWatch《〈 简 称 OSW) 是 Oracle 的 一 个 操作 系统 监控 工具 ， 可 以 从 Metalink 上 下 载 (Node 
301137.1), OSW 是 一 个 轻 量 级 的 操作 系统 监控 工具 , 通过 一 个 后 台 进 程 进行 调度 , 使 用 vmstat, 
iostat 等 操作 系统 命令 对 操作 系统 的 主要 指标 进行 监控 , 并 形成 历史 数据 。OSW 对 系统 的 开销 
十 分 小 ,部 署 也 十 分 方便 ,只 要 用 tar 解 开 安装 包 就 完成 安装 了 。.OSW 采集 的 信息 可 以 通过 OSWG 
工具 生成 图 表 。OSWG 是 一 个 Java 的 应 用 ， 可 以 在 服务 器 上 运行 。 如 果 服 务 器 支持 图 形 界面 ， 
可 以 直接 在 服务 器 上 观看 ， 如 果 服 务 器 不 支持 图 形 界面 ， 也 可 以 直接 生成 图 形 文件 ， 然 后 下 载 到 
微机 上 查看 。 
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PREE) 转 储 文件 内 容 3， 转 储 控制 文件 
通过 设置 系统 事件 ， 可 以 把 控制 文件 转 储 到 Trace 文件 : 


ALTER SESSION SET EVENTS 'immediate trace name controlf level «level»'; 


<level> 的 取 值 如 下 表 所 示 。 





Level 转 储 的 内 容 
1 文件 头 信息 
2 文件 头 信息 数据库 信息 记录 和 检查 点 进程 记录 
3 所 有 的 记录 ,仅仅 包含 最 新 和 最 老 的 循环 使 用 类 型 的 记录 
4 类 似 3， 不 过 包含 4 条 最 新 的 循环 使 用 类 型 的 记录 


5+ 类 似 3， 循 环 使 用 类 型 的 记录 是 每 个 级 别 的 双 倍 
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通过 这 几 天 的 分 析 ， 这 个 系统 的 主要 问题 基本 上 清晰 了 。 由 于 受到 硬件 资产 的 限制 ， 这 个 系 
统一 直 处 于 硬件 资源 的 临界 状态 和 运行， 一旦 某 个 业务 出 现 了 10% 以 上 的 增长 ， 就 会 导致 CPU 或 
者 VO 出 现 瓶 颈 ， 从 而 导致 整个 系统 性 能 大 幅度 下 降 。 因 此 如 果 某 个 人 通过 SQL*Plus 上 去 跑 一 
个 查询 ， 就 可 能 导致 系统 在 半 个 小 时 里 出 现 严重 的 性 能 问题 。 虽 然 运 维 部 已 经 三 令 五 申 ， 从 早上 
8 : 30 到 晚上 18 : 00 之 间 严 禁 通 过 SQL*Plus 连 上 去 ， 不 过 由 于 业务 需要 ， 假 如 领导 临时 要 一 个 
数据 ， 而 这 个 数据 又 是 系统 无 法 提供 的 ， 那 么 就 必须 连 上 去 查询 了 。 

从 目前 的 角度 来 看 , 扩容 硬件 是 最 好 的 解决 方案 , 但 是 由 于 甲 方 决定 采用 大 集中 的 方案 , 各 
省 的 系统 将 在 2 年 后 全 部 纳入 大 区 进行 管理 ,所 以 目前 硬件 投资 和 扩容 是 不 可 能 的 ,这 其实 也 是 
集团 公司 领导 决定 进行 调 优 的 初衷。 

如 果 排 除了 硬件 扩容 的 方案 , 那么 就 不 可 避免 地 要 进行 应 用 的 优化 。 而 以 目前 应 用 开发 商 的 
情况 来 说 ， 如 果 涉 及 SQL 的 优化 ， 那 就 是 个 很 大 的 问题 。 这 个 项 目 要 求 的 周期 这 么 紧张 ， 如 果 
在 6 月 20 日 前 应 用 厂商 无 法 将 我 们 提出 要 修改 的 Top SQL 修改 完毕 ， 那么 优化 的 效果 就 无 法 
在 7 月 份 评估 完成 ,计划 中 的 7 月 中 旬 进 行 的 验收 也 就 无 从 谈 起 了 。7 月 上 旬 完 成 整个 项 目的 验 
收 是 小 齐 在 确定 这 个 项 目 进度 时 一 再 强调 的 ， 因 为 整个 北方 公司 9 个 省 的 调 优 工作 必须 在 今年 
12 月 底 前 完成 ， 而 能 否 拿 下 北方 公司 全 部 的 合同 ， 必 须 看 辽宁 的 优化 效果 ， 如 果 优 化 效果 不 理 
想 ， 那 么 北方 公司 可 能 会 终止 这 个 项 目 。 如 果 7 月 上 和 旬 无 法 完成 验收 ， 那 么 验收 可 能 就 要 推 到 8 
月 份 进行 , 验收 后 安排 的 那 次 研讨 会 的 时 间 只 能 推迟 到 9 月份, 研讨 会 后 再 启动 整个 北方 公司 的 
项 目 ， 到 签署 合同 ， 估 计 就 要 到 12 月 了 ， 这 样 ，12 月 底 前 完成 北方 公司 整个 项 目 实施 就 绝 无 可 
能 了 。 而 这 个 项 目 是 本 年 度 的 项 目 ， 跨 财务 年 度 是 不 现实 的 。 为 了 保证 其 他 各 省 的 项 目 能 够 如 期 
在 11 月 份 开始 启动 ， 我 们 这 个 项 目 必 须 控 制 在 7 月 上 旬 验 收 。 

我 刚刚 接 到 这 个 项 目 需求 时 ,对 7 月 份 验收 的 信心 还 是 很 足 的 ， 从 初步 拿 到 的 资料 分 析 ， 这 
个 系统 提升 30% 不 难 ， 其 至 不 需要 优化 SQL 就 可 以 做 到 。 而 从 目前 的 情况 来 看 ， 这 个 系统 需要 
的 不 仅仅 是 30% 的 性 能 提升 而 已 。 况且 对 于 这 种 处 于 容量 临界 状态 运行 的 系统 ,其 排队 效应 是 十 
DRY, 通过 一 定 手 段 的 优化 ， 系 统 中 的 等 待 事件 可 以 大 幅度 下 降 ， 其 至 可 以 下 降 50%。 不 过 这 
种 下 降 对 整体 性 能 的 提升 作用 并 不 大 ,因为 系统 中 还 积压 了 大 量 等 待 处 理 的 事务 , 一 旦 通过 调整 
后 ， 系 统 的 等 待 事件 下 降 了 ,那么 大 量 的 正在 排队 的 事务 会 挤 入 ， 这 样 刚刚 释放 出 来 的 资源 又 会 
被 这 些 排队 的 事务 占用 , 优化 后 降低 的 资源 消耗 仍然 无 法 消化 掉 这 些 排队 的 事务 , 这 样 系统 的 整 
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体 性 能 并 不 会 有 明显 的 改善 。 从 这 方面 来 讲 ， 如 果 不 做 SQL 优化 ， 通 过 其 他 应 急 的 优化 ， 可 以 
短期 解决 一 定 的 性 能 问题 , 甚至 可 能 做 到 性 能 提升 30% 的 目标 , 完成 验收 , 但 是 随 着 业务 量 的 增 
长 ， 几 个 月 后 ， 系 统 资源 瓶颈 将 会 再 次 出 现 ， 这 个 系统 可 能 又 会 回 到 优化 前 的 状态 。 

基于 上 面 的 考虑 , SQL 优化 是 必需 的 , 而 且 必 须 做 到 位 , 这 样 这 个 项 目 才 可 能 顺利 达成 目标 ， 
在 大 集中 前 维持 稳定 的 运行 状态 。 到 目前 为 止 ， 已 经 发 现 对 系统 性 能 影响 较 大 的 Top SQL 30 £ 
个 ， 这 些 SQL 消耗 了 超过 60% 的 CPU 资源 和 50% 以 上 的 VO 资源 ， 如 果 能 够 优化 ， 就 可 以 大 幅 
度 减 少 资源 开销 ， 实 现 我 们 的 目标 。 不 过 这 些 SQL 提交 到 开发 商 手 中 已 经 有 儿 天 了 ， 没 有 任何 
反馈 信息 。 我 自己 也 做 过 几 年 开发 工作 ,知道 软件 开发 人 员 的 难处 ,特别 是 现在 这 种 情况 ,一 套 
系统 全 国 儿 十 个 地 方 在 用 ,要 修改 任何 一 处 ,都 会 涉及 版 本 管理 的 问题 ， 想 要 从 他 们 那里 很 快 获 
得 反馈 确实 有 点 难度 。 

下 午 收 到 一 个 邮件 , 是 开发 商 关 于 SQL 优化 的 反馈 ,感到 有 些 意外 , 因为 邮件 的 标题 是 “SQL 
优化 已 完成 ， 将 于 5 月 23 日 前 完成 实施 ”。 在 两 三 天 内 完成 了 30 多 个 Top SQL 的 优化 ， 其 中 不 
乏 文 本 长 度 超过 20KB 的 超大 SQL, 这 么 高 的 效率 是 前 所 未 有 的 。 打 开 附 件 , 我 顿时 有 一 种 被 加 
弄 的 感觉 。 原 来 开发 厂商 的 处 理 方案 中 ,除了 儿 个 明显 缺少 索引 的 SQL 通过 添加 索引 来 解决 外 ， 
其 他 的 SQL 全 部 被 说 明 为 “已 经 经 过 两 年 多 的 优化 ， 已 无 优化 余地 ” ， 实 际 上 应 用 开发 厂商 几乎 
拒绝 了 所 有 SQL 的 修改 。 

老 于 不 停 地 抽 着 烟 ， 我 们 两 个 在 机 房 外 的 楼 梯 间 里 研究 了 个 把 小 时 ， 也 没有 什么 好 的 对 策 。 
从 这 个 邮件 上 来 看 , 我 们 可 能 要 面临 得 不 到 应 用 开发 厂商 支持 独立 作战 的 不 利 局 面 , 要 想 达 成 优 
化 目标 ， 难 度 会 大 大 增加 。 我 们 必须 独立 完成 SQL 的 优化 ， 把 优化 方法 以 及 结果 提交 给 客户 ， 
然后 由 客户 去 压 应 用 厂商 修改 软件 。 这 样 的 话 我 们 的 优化 建议 必须 在 6 H 10 日 之 前 提交 给 客户 ， 
否则 应 用 开发 厂商 可 以 以 “时 间 太 短 ， 无 法 完成 ”为 由 再 次 拒绝 我 们 的 方案 。 从 现在 来 看 ,我 们 
只 有 不 到 一 个 月 的 时 间 ， 要 完成 50—70 个 SQL 的 优化 工作 ， 平均 每 天 要 完成 1~2 个 SQL, K 
中 大 多 数 SQL 都 是 超过 5 个 表 连 接 的 超大 型 SQL， 工 作 量 之 大 ， 前 所 未 有 。 

为 了 减少 这 段 时 间 由 于 突 发 性 故障 引起 的 问题 , 我 和 老 于 向 孙 主 任 提出 建议 , 这 段 时 间 一 概 
禁止 客户 端 通过 SQL*Plus, PL/SQL Developer 等 工具 连 到 数据 库 上 做 大 的 查询 ， 一 旦 发 现 这 种 
操作 ， 我 们 会 主动 杀 掉 这 些 进程 。 孙 主任 同意 了 这 个 提议 , 决定 今天 就 发 文 给 各 个 部 门 。 我 这 边 
也 安排 开发 商 的 小 孙 负 责 这 件 事情 。 我 给 了 小 孙 一 个 查找 大 开销 SQL 的 脚本 ， 让 他 定期 跑 一 下 
这 个 脚本 ， 一 旦 发 现 某 个 不 是 应 用 程序 进行 的 大 型 操作 ， 就 直接 杀 掉 会 话 。 这 个 脚本 是 Metalink 
上 的 一 个 脚本 ， 内 容 如 下 : 


SELECT 

L.sid ssid, 

substr(OPNAME,1,15) opname, 

target, 

trunc((sofar/totalwork)*100) pct, 

to char(60*sofar*8192/(24*60*(last update time - start time))/1024/1024/60, '9999.0') 
Rate, 

elapsed seconds/60 es, 
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time remaining/60 tr,PROGRAM, MACHINE 
FROM v$session longops L,V$SESSION S 
WHERE time remaining » 0 AND L.SID-S.SID 
ORDER BY start time 

/ 











I/O Time Time 
SID OPNAME TARGET PCT Rate/m Ran Left PROGRAM MACHINE 


3086 Table Scan CRTA RPT.RPT TRANSFER BAR 36.00 478. .3 .58 oracle@mrp1 (JO ods2 
2668 Table Scan MONITOR DB.FACT REAL DELAY D 37.00 386. .2 .37 oracle@monitord monitordb 


如 果 PROGRAM 是 SQL *Plus 或 者 其 他 第 三 方 工具 , 在 做 业务 表 的 大 型 扫描 操作 时 , 这 种 操 
作 可 能 会 引起 系统 性 能 问题 。 通 过 MACHINE 可 以 知道 是 谁 在 做 这 个 操作 ， 除 了 几 个 特殊 的 
MACHINE 外 ， 所 有 的 做 这 种 危险 操作 的 会 话 都 在 立即 清理 的 范畴 之 内 。 我 们 授权 小 孙 ， 可 以 随 
时 杀 掉 这 些 会 话 。 

对 于 这 样 的 系统 ， 禁 止 由 于 某 个 人 在 业务 高 峰 期 间 执行 一 些 高 开销 SQL， 可 以 有 效 防止 一 
些 不 必要 的 系统 故障 。 这 个 方法 在 很 多 以 往 的 优化 项 目 中 都 采用 过 ， 效 果 还 不 错 ， 因 此 这 一 次 我 
们 在 沈阳 也 使 用 了 。 有 具体 能 有 多 大 效果 ， 就 看 小 孙 是 不 是 尽心 尽责 了 ， 因 为 实践 证 明 ， 光 靠 行政 
命令 是 无 法 杜绝 这 样 的 操作 的 ， 孙 主任 的 通知 虽然 发 出 去 了 , 不 过 又 有 儿 个 人 能 够 遵守 呢 ? 实际 
上 ， 发 出 这 个 通知 只 是 为 小 孙 杀 会 话 找 一 个 合适 的 理由 。 

为 了 解决 男 一 项 目 出 现 的 紧急 情况 , 我 将 在 本 周末 暂时 离开 这 个 项 目 一 段 时 间 , 因此 必须 让 
老 能 马上 结束 南京 的 事情 ， 立 即 加 入 这 个 项 目 ， 否 则 时 间 就 来 不 及 了 。 下 午 和 老 能 通 了 电话 ， 他 
最 快 这 个 周末 可 以 离开 南京 。 老 于 听 到 消息 也 松 了 一 口气 ,， 老 能 的 提前 加 入 ， 是 十 分 关键 的 ,在 
SQL 优化 方面 ,老人 能 的 经 验 要 比 老 于 和 老 肖 丰富 得 多 , 他 可 以 填补 我 离开 的 空缺 ,确保 项 目的 进 
度 。 


E 之 优化 由 技巧 ) 查找 Top SQL 


RIL Top SQL 的 方法 很 多 ， 最 常用 的 方法 是 从 STATSPACK 报告 中 查找 Top SQL, 5, 
OEM Top SQL 工具 OEM SQL Analyzer, 10g ADDM 等 都 是 查找 Top SQL 的 好 工具 ， 还 可 以 从 
v$sqlarea 中 直接 查询 。 

查找 Top SQL 的 依据 包括 以 下 几 个 方面 。 

a 查找 总 的 缓冲 区 获取 比较 高 的 SQL， 并 根据 平均 每 次 执行 缓冲 区 获取 的 数量 判断 优化 的 

余地 有 多 大 。 优 化 这 些 SQL， 有 助 于 减少 CPU 开销 以 及 数据 缓冲 池 相 关 的 门 锁 竞争 。 

查找 总 的 物理 读 比较 高 的 SQL， 并 根据 平均 每 次 执行 物理 读 的 数量 判断 优化 的 余地 有 多 

大 。 优 化 这 些 SQL， 有 助 于 减少 IO 开销 和 CPU 开销 。 

O 单 次 执行 开销 较 大 的 SQL 也 属于 重点 优化 之 列 ， 但 是 对 于 某 些 执行 次 数 不 多 、 总 的 开销 
排名 不 靠 前 的 SQL， 优化 后 对 系统 的 影响 也 许 并 不 十 分 大 。 由 于 SQL 优化 是 个 十 分 消耗 
人 力 资源 的 工作 ， 所 以 有 时 候 这 类 SQL 不 一 定 作为 优化 的 重点 。 

查找 Top SQL 的 主要 工具 包括 以 下 几 种 。 


















































口 
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O STATSPACK 报告 : STATSPACK 报告 中 的 Top SQL 是 比较 全 面 的 ， 而 且 也 具有 一 定 的 代 
表 性 。 不 过 STATSPACK 报告 中 的 SQL 一 般 来 说 是 残缺 不 全 的 。 可 以 通过 sprepsql.sql 脚 
本 生成 SQL 报告 ， 这 份 SQL 报告 里 包含 完整 的 SQL 文本 和 SQL 执行 的 开销 ， 如 果 
STATSPACK 的 Snap Level 是 6 级 或 者 以 上 ， 报 告 里 还 将 包括 SQL 的 执行 计划 等 信息 。 

O AWR 报告 和 STATSPACK 报告 类 似 ，Oracle 10g AWR 也 可 以 查找 Top SQL. AWR 的 基 
本 Snap 级 别 就 包含 了 SQL 的 执行 计划 。 因 此 ， 可 以 使 用 awrsqrpt.sql 直接 生成 某 个 SQL 





的 AWR 报告 。 

a 9i OEM Top SQL: 9i OEM 里 有 一 个 Top SQL 工具 ， 可 以 根据 不 同 的 过 滤 条 件 和 排序 顺 
序 查找 各 类 Top SQL。 

a 9i SQL Analyzer 优化 工具 : SQL Analyzer th OEM 附带 的 一 个 工具 包 , 该 工具 包 是 一 个 





很 不 错 的 SQL 优化 工具 ， 不 仅 可 以 查找 Top SQL， 还 可 以 辅助 分 析 SQL， 并 可 以 提出 一 
些 优化 建议 。 

10g ADDM: ADDM 提供 的 SQL 优化 功能 更 为 强大 ， 优 化 建议 功能 也 更 强 。ADDM 可 以 
根据 SQL 对 系统 的 影响 度 ， 对 Top SQL 进行 排序 。 找 到 Top SQL 后 ， 可 以 立即 使 用 优化 
可 导 进 行 优化 分 析 。 

口 TRCA ;Oracle 分 析 10046 Trace 文件 的 一 个 工具 ,可 以 从 10046 Trace 文件 中 分 析 Top SQL, 
TRCA 可 以 从 Metalink 上 下 载 (文档 224270.1)。 

SQLAREAT; — Top SQL 分 析 工 具 ， 从 SQL area 中 抓 取 Top SQL. SQLAREAT 可 以 从 
Metalink 上 下 载 (文档 238684.1)。 

在 上 面 介绍 的 工具 中 ，STATSPACK、AWR、ADDM 是 根据 某 个 时 间 段 中 SQL 对 整个 系统 
的 开销 来 进行 分 析 和 排序 的 , 而 其 他 工具 侧重 于 对 当前 系统 中 累计 信息 进行 排序 ， 因此 通过 不 同 
的 工具 查找 出 来 的 Top SQL 可 能 不 同 。 在 做 优化 时 ， 不 能 仅仅 考虑 单条 SQL 的 开销 ， 更 要 考虑 
那些 执行 次 数 比 较 多 、 总 开销 较 大 的 SQL。 


E 人 优化 小 技巧 ) 索引 设计 的 一 些 建议 


索引 对 改善 数据 库 访 问 性 能 的 作用 十 分 巨大 ， 设 计 合理 的 索引 对 于 系统 性 能 调整 至 关 重要 ， 
而 使 用 索引 又 是 数据 库 开发 过 程 中 最 困难 的 一 点 。 在 设计 索引 时 要 注意 以 下 几 个 方面 。 
a 在 OLTP 系统 中 ， 尽 量 避 免 全 表 扫 描 ， 尽 量 使 绝 大 多 数 操作 都 通过 索引 访问 。 
a 数据 量 很 大 并 且 经 常 变 动 的 表 上 的 索引 不 易 过 多 ， 过 量 的 索引 会 导致 插入 、 更 新 和 删除 
操作 变 慢 ， 产 生 大 量 的 VO, 
a 如 果 索 引 数 量 过 多 ， 并 且 很 多 列 包含 在 多 个 索引 中 ， 就 要 考虑 使 用 合适 的 复合 索引 来 替 
代 几 个 其 他 的 索引 。 
小 表 不 要 建立 索引 ， 通 过 索引 访问 速度 可 能 更 慢 ， 把 小 表 放 人 和 人 keep 池 可 能 效率 更 高 。 
索引 的 PCTFREE, INITTRANS, MAXTRANS 参数 设置 十 分 重要 ,特别 是 对 于 变化 十 分 大 的 
索引 。 
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O 对 于 比较 大 的 索引 ， 使 用 索引 分 区 会 改善 效率 。 

a 位 图 索引 对 于 列表 类 值 的 效果 较 好 (索引 也 比较 小 )， 但 是 位 图 索引 不 适合 变化 十 分 频繁 

的 表 ， 因 为 位 图 索引 在 变更 时 会 锁 住 相应 的 一 组 记录 而 不 仅仅 是 一 条 记录 。 

O 在 某 些 情况 下 ， 使 用 图 数 索引 可 以 避免 大 量 不 必要 的 全 表 扫 描 。 

O 如 果 索 引 包含 了 查询 需要 的 所 有 信息 ， 查 询 就 不 需要 访问 表 的 数据 ， 这 可 以 大 大 提高 访 
问 效率 。 因 此 ， 要 注意 建立 合理 的 复合 索引 ， 适 当 添 加 一 些 额外 的 字段 可 能 会 起 到 很 好 
的 优化 效果 ， 另 外 也 要 注意 SQL 语句 的 合理 性 ， 绝 对 不 检索 不 适用 的 列 。 

O 用 好 索引 组 织 表 。 索 引 组 织 表 是 一 种 十 分 特殊 的 表 ， 这 个 表 的 结构 本 身 就 是 一 个 索引 。 

a 可 以 使 用 反 转 索 键 值 索 引 来 消除 索引 相关 的 热 块 。 

O 随 着 数据 的 变化 ， 索 引 的 效率 会 下 降 ， 因 此 定期 重建 索引 对 于 性 能 提升 有 很 大 帮助 。 

a 使 用 CBO 优化 器 的 情况 下 ,保证 表 和 索引 的 数据 得 到 了 良好 的 分 析 是 保证 优化 器 选择 最 

佳 执行 计划 的 关键 。 

O 删除 所 有 不 必要 的 索引 。Oracle 9i 提 供 的 新 特性 可 以 使 DBA 能 够 跟踪 索引 的 使 用 情况 ， 

用 这 个 功能 找到 不 使 用 的 索引 ， 并 把 这 些 索引 删除 掉 。 

O 如 果 某 个 索引 确实 可 以 提高 SQL 的 性 能 ， 减 轻 系统 的 整体 负载 ， 那 么 这 个 索引 就 是 必须 

加 的 ， 哪 怕 这 张 表 上 以 前 已 经 创建 了 20 个 索引 。 一 张 表 上 的 索引 数 不 能 超过 多 少 这 类 说 

法 是 没有 依据 的 ， 从 实际 需求 出 发 才 是 最 关键 的 。 


去 人 优化 小 技巧 ) 什么 是 索引 的 集群 因子 


什么 是 集群 因子 (Clustering Factor) We? 集群 因子 是 通过 一 个 索引 扫描 一 张 表 时 需要 访问 的 
表 的 数据 块 的 数量 。 集 群 因子 的 计算 方法 如 下 : 

(1) 扫描 一 个 索引 ; 

(2) 比较 某 行 的 ROWID 和 前 一 行 的 ROWID ， 如 果 这 两 个 ROWID 不 属于 同一 个 数据 块 ， 那 
么 集群 因子 增加 1， 

(3) 整个 索引 扫描 完毕 后 ， 就 得 到 了 该 索引 的 集群 因子 。 

以 上 面 集 簇 因子 的 计算 方式 可 以 看 出 , 集 徐 因 子 反映 了 索引 范围 扫描 可 能 带 来 的 对 整个 表 访 
问 过 程 的 IO 开销 情况 ， 如 果 集 群 因子 接近 于 表 存 储 的 块 数 ， 说 明 这 张 表 是 按照 索引 字段 的 顺序 
存储 的 。 如 果 集 群 因子 接近 于 行 的 数量 ， 那 说 明 这 张 表 不 是 按 索引 字段 顺序 存储 的 。 在 计算 索引 
访问 成 本 时 ， 集 群 因子 十 分 有 用 。 集 群 因子 乘 以 选择 性 参数 就 是 访问 索引 的 开销 。 

如 果 这 个 统计 数据 不 能 反映 出 索引 的 真实 情况 ， 那 么 可 能 会 造成 优化 器 错误 地 选择 执行 计 
划 。 另 外 ， 如 果菜 张 表 上 的 大 多 数 访 问 是 按照 某 个 索引 做 索引 扫描 ， 那么 将 该 表 的 数据 按照 索引 
字段 的 顺序 重新 组 织 ， 可 以 提高 该 表 的 访问 性 能 。 


E 3 优化 小 技 巧 ) 转 储 文件 内 容 A. 转 储 控制 文件 
使 用 ALTER SYSTEM DUMP LOGFILE 可 以 转 储 在 线 日 志文 件 。 也 可 以 使 用 ALTER SESSION 















































44 Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





命令 去 转 储 重 做 日 志 头 的 信息 。 在 数据 库 处 于 NOMOUNT, MOUNT 或 者 OPEN 状态 时 ， 就 可 以 
使 用 上 面 的 命令 。 当 操作 系统 相同 的 情况 下 ， 可 以 通过 客户 端 去 转 储 另外 一 个 数据 库 的 重 做 








日 志 。 重 做 日 志 的 信息 会 被 写 入 一 个 Trace 文件 。 
可 以 用 下 面 的 方法 转 储 在 线 日 志 。 
a 根据 DBA (Data Block Address) 转 储 记录 。 
a 根据 RBA (Redo Block Address) 转 储 记录 。 
O 根据 时 间 点 去 转 储 记录 。 
a 根据 层次 和 操作 码 转 储 记录 。 
a 转 储 文件 头 信息 
a 转 储 整个 重 做 日 志文 件 
下 面 分 别 介绍 一 下 有 关 的 命令 。 
1. 根据 DBA 转 储 在 线 日 志 记录 
转 储 跟 某 个 或 某 些 数 据 块 相关 的 重 做 日 志 记录 , 转 储 出 来 的 信息 只 
如 下 : 


ALTER SYSTEM DUMP LOGFILE 'filename' 
DBA MIN fileno . blockno 

DBA MAX fileno . blockno; 
比如 : 





ALTER SYSTEM DUMP LOGFILE 
'u01/oracle/V7323/dbs/arch1l 76.dbf' 

DBA MIN 5 . 31125 

DBA MAX 5 . 31150; 


这 个 命令 转 储 5 号 文件 的 31125 ~31150 块 相关 的 记录 。 
2. 根据 RBA 转 储 在 线 日 志 记 录 
通过 重 做 地 址 的 范围 转 储 在 线 日 志 的 记录 ， 语 法 如 下 : 


ALTER SYSTEM DUMP LOGFILE 'filename' 
RBA MIN seqno . blockno 
RBA MAX seqno . blockno; 


比如 说 





ALTER SYSTEM DUMP LOGFILE 'u01/oracle/V7323/dbs/arch1_76.dbf' 


RBA MIN 2050 . 13255 
RBA MAX 2255 . 15555; 


3. 根据 时 间 点 转 储 在 线 日 志 记录 
可 以 通过 时 间 范 围 来 转 储 某 段 时 间 内 产生 的 重 做 记录 ， 语 法 如 下 : 


ALTER SYSTEM DUMP LOGFILE 'filename' 
TIME MIN value 
TIME MAX value; 


比如 : 


ALTER SYSTEM DUMP LOGFILE'u01/oracle/V7323/dbs/archi 76.dbf' 














这 些 数据 块 相关 ， 
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TIME MIN 299425687 
TIME MAX 299458800; 


下 面 介 绍 一 下 如 何在 redo dump time fl date 类 型 之 间 进 行 相互 转换 。 
date 转换 为 redo dump time 格式 的 脚本 如 下 (转载 Metalink 上 的 脚本 ) : 


SET ECHO off 





REM NAME : TFSTM2RD.SQL 

REM USAGE:"Gpath/tfstm2rd" 

REM ——— II P 
REM REQUIREMENTS : 

REM None. 

REM =c n r m II mn 
REM AUTHOR: 

REM Anonymous 

REM Copyright 1996, Orqacle Corporation 

REM ———— III Ir rr rr mm Ir r 
REM PURPOSE: 

REM Converts a standard date into redo dump time format. 

REM. ——— AY W. III m. et eue. 
REM EXAMPLE: 

REM Enter day (DD/MM/YYYY) ? 08/07/1996 

REM Enter time (HH24:MI:SS) ? 12:05:05 

REM 

REM REDO_YEAR REDO_MONTH REDO_DAY REDO_HOUR REDO_MIN REDO_SEC 

REM = E E E EE | E E E E 

REM 1996 7 8 12 5 5 

REM 

REM EDO TIME 

REM 一 一 一 一 一 一 一 一 一 二 

REM 273845105 

REM 

REM 一 二 一 一 一 一 一 二 一 二 一 二 一 二 二 二 一 二 二 一 二 
REM DISCLAIMER : 

REM This script is provided for educational purposes only. It is NOT 

REM supported by Oracle World Wide Technical Support. 

REM The script has been tested and appears to work as intended. 

REM You should always run new scripts on a test instance initially. 

REM SSS SSS SS SSS SSS SS SS 


REM Main text of script follows: 


undefine redo_day 
undefine redo_hhmiss 


accept redo_day prompt "Enter day (DD/MM/YYYY) ? " 
accept redo_hhmiss prompt "Enter time (HH24:MI:SS) ? " 


column redo year new value redo year format 9999 
column redo month new value redo month format 9999 
column redo day new value redo day format 9999 
column redo hour new value redo hour format 9999 
column redo min new value redo min format 9999 
column redo sec new value redo sec format 9999 
column redo time new value redo time 
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set verify off 
SELECT 
to number(to char(to date('&redo day &redo hhmiss', 
'DD/MM/YYYY HH24:MI:SS'),'YYYY')) redo year, 
to number(to char(to date('&redo day &redo hhmiss', 
'DD/MM/YYYY HH24:MI:SS'),'MM')) redo month, 
to number(to char(to date('&redo day &redo hhmiss', 
'DD/MM/YYYY HH24:MI:SS'),'DD')) redo day, 
to number(to char(to date('&redo day &redo hhmiss', 
'DD/MM/YYYY HH24:MI:SS'),'HH24')) redo hour, 
to number(to char(to date('&redo day &redo hhmiss', 
'DD/MM/YYYY HH24:MI:SS'),'MI')) redo min, 
to number(to char(to date('&redo day &redo hhmiss', 
'DD/MM/YYYY HH24:MI:SS'),'SS')) redo sec 
FROM dual; 
SELECT ( ( ( ( ( ( &redo year - 1988 ) 
) * 12 
+ ( &redo month - 1 ) 
)* 31 
+ ( &redo day - 1 ) 
) * 24 
+ ( &redo hour ) 
) * 60 
+ ( &redo min ) 
) * 60 
+ ( k&redo sec ) redo time 
FROM dual; 


下 面 是 使 用 该 脚本 的 例子 : 


Enter day (DD/MM/YYYY) ? 08/07/1996 
Enter time (HH24:MI:SS) ? 12:05:05 


REDO YEAR REDO MONTH REDO DAY REDO HOUR REDO MIN REDO SEC 


273845105 


将 redo dump time 转 为 date 格式 的 脚本 如 下 (转载 Metalink 上 的 脚本 ) : 


SET ECHO off 


REM NAME: TFSRD2TM.SQL 

REM USAGE:"Gpath/tfsrd2tm" 

REM :一 一 一 一 二 二 二 二 
REM REQUIREMENTS : 

REM None . 

REM === =I rr rra 


REM AUTHOR: 
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REM Anonymous 

REM Copyright 1996, Oracle Corporation 

REM = 
REM PURPOSE : 

REM Will convert redo dump time into a readable date. 

REM 

REM ——— SSS a a E E E 
REM EXAMPLE: 

REM Enter redo time ? 273845105 

REM 

REM REDO_YEAR REDO_MONTH REDO_DAY REDO_HOUR REDO_MIN REDO_SEC 

REM NN s SSS SSS SSS SSS a 

REM 1996 7 8 12 5 5 

REM 

REM = 
REM DISCLAIMER : 

REM This script is provided for educational purposes only. It is NOT 

REM supported by Oracle World Wide Technical Support. 

REM The script has been tested and appears to work as intended. 

REM You should always run new scripts on a test instance initially. 

REM, ——— rn m r r ——À—— SSS 


REM Main text of script follows: 


undefine redo_time 


accept redo_time prompt "Enter redo time ? " 


column redo year new value redo year format 9999 
column redo month new value redo month format 9999 
column redo. day new value redo day format 9999 
column redo hour new value redo hour format 9999 
column redo min new value redo min format 9999 
column redo sec new value redo sec format 9999 


set verify off 
SELECT 


trunc(trunc(trunc(trunc(trunc(&redo time/60)/60)/24)/31)/12)41988 redo year, 
mod(trunc(trunc(trunc(trunc(&redo time/60)/60)/24)/31),12 )+1 redo month, 


mod(trunc(trunc(trunc(&redo time/60)/60)/24), 31)+1 redo. day, 
mod(trunc(trunc(&redo time/60)/60),24) redo hour, 
mod(trunc(&redo time/60),60) redo min, 
mod(&redo_time, 60) redo_sec 

FROM dual; 

执行 的 例子 如 下 : 


Enter redo time ? 273845105 


REDO YEAR REDO MONTH REDO DAY REDO HOUR REDO MIN REDO SEC 
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4. 根据 层次 和 操作 代码 转 储 记录 
根据 层次 和 操作 码 可 以 转 储 某 种 类 型 的 记录 ， 命 令 格式 如 下 : 


ALTER SYSTEM DUMP LOGFILE 'filename' 
LAYER value 
OPCODE value; 


比如 : 


ALTER SYSTEM DUMP LOGFILE 'u01/oracle/V7323/dbs/archl, 76.dbf' 
LAYER 11 
OPCODE 3; 


5. 转 储 文件 头 信息 
使 用 下 列 命令 可 以 转 储 文件 头 信息 : 
ALTER SESSION SET EVENTS'immediate trace name redohdr level 10'; 

6. 转 储 整个 重 做 日 志 

使 用 下 列 命令 可 以 转 储 整个 重 做 日 志 : 

ALTER SYSTEM DUMP LOGFILE 'filename'; 

EE An: 

ALTER SYSTEM DUMP LOGFILE 'u01/oracle/V7323/dbs/arch1 76.dbf'; 

ALTER SYSTEM DUMP LOGFILE 'filename' 命 令 既 可 以 转 储 在 线 日 志文 件 ， 也 可 以 转 储 归档 
日 志文 件 。 

对 于 Oracle 7 或 以 前 的 数据 库 ，Oracle 可 以 把 归档 日 志 直 接 写 入 磁带 。Oracle 也 支持 从 磁盘 
或 者 磁带 上 读 取 归档 日 志 。 如 果 从 磁盘 上 读 取 归 档 日 志 ， 文 件 名 的 格式 是 : 

D:MINIDISK:DATASET 
其 中 DATASET 是 文件 名 。 比 如 : 

ALTER SYSTEM DUMP LOGFILE 'd:golddba.230.230.readpass.multpass:1123.0ra'; 
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由 于 江苏 的 项 目 出 现 一 个 紧急 问题 ,我 只 能 暂时 离开 项 目 组 一 周 的 时 间 ， 幸 亏 老 能 已 经 提前 
加 入 ,给 我 和 老 于 一 个 不 小 的 安慰 。 老 能 从 事 DBA 工作 差不多 10 年 了 ,其 严谨 和 执着 的 态度 以 
及 丰富 的 经 验 都 是 我 们 所 需要 的 。 

老 熊 是 早上 从 南京 过 来 的 ,而 我 要 飞 南京 ， 所 以 决定 在 机 场 见面 。 我 计算 过 ， 如果 老 熊 的 航 
班 不 晚点 一 个 小 时 以 上 , 我 们 在 机 场 就 有 足够 的 时 间 做 一 个 交接 。 还 好 老 熊 的 航班 十 分 准点 , 我 
们 两 个 在 机 场 找 了 一 个 茶座 , 我 向 老 能 介绍 了 这 边 的 情况 , 重点 介绍 了 开发 商 那 边 的 态度 以 及 我 
们 的 目标 。 同 时 我 也 把 这 几 天 采集 的 Top SQL 交 给 了 老 熊 ， 并 且 告 诉 他 其 中 有 儿 个 SQL 是 最 关 
键 的 ， 不 过 这 些 SQL 都 比较 大 ， 大 多 数 是 五 六 张 表 连 接 的 大 型 查询 ， 我 建议 他 首先 不 要 碰 那 几 
个 特别 大 的 查询 ， 先 从 简单 的 人 手 。 老 能 说 等 他 仔细 看 看 这 些 SQL 后 再 做 决定 。 和 老 能 简单 交 
接 了 文档 后 ， 我 就 匆匆 离开 了 沈阳 。 

老 熊 和 我 一 起 合作 有 一 两 年 了 ，2005 年 开始 他 就 负责 南京 那 边 的 业务 ， 江 苏 的 客户 对 老 能 
的 评价 是 水 平 很 高 ， 人 品 也 好 ,， 干 活 比较 踏实 。 从 这 几 天 我 和 老 于 的 接触 来 看 ， 老 能 和 老 于 的 性 
格 相仿 ， 我 相信 他 们 之 间 的 合作 不 会 存在 什么 问题 。 老 能 的 酒量 也 很 不 错 ， 没 事 的 时 候 喜 欢 喝 点 
小 酒 , 这 一 点 和 老 于 肯定 会 很 投缘 。 唯一 不 足 的 是 老 能 不 抽烟 , 也 从 来 没有 和 抽烟 的 人 一 起 做 事 ， 
和 老 于 这 杆 老 烟 枪 在 一 起 工作 ， 估 计 需 要 戴 一 个 防毒 面具 才 行 。 

江苏 的 问题 比较 环 手 , 一 个 月 前 , 他 们 的 BSS 系统 出 现 了 由 于 ORA-60 错误 而 导致 整个 实例 
被 短 时 挂 住 的 问题 。 开 始 时 这 个 问题 只 是 在 某 个 本 地 网 的 系统 中 出 现 ， 后 来 随 着 业务 量 的 增加 ， 
好 几 个 本 地 网 都 出 现 了 类 似 的 问题 , 有 时 其 至 会 导致 整个 系统 被 挂 起 5~ 10 分 钟 ， 严 重 影响 了 业 
务 。 

Oracle 公司 也 派 工 程 师 对 这 个 故障 做 过 儿 次 相关 的 分 析 。Oracle 公司 方面 初步 确定 为 bug 引 
起 ,建议 他 们 先 打 一 个 补丁 。 由 ORA-60 错误 而 导致 实例 挂 住 的 bug 我 也 遇 到 过 ， 所 以 建议 他 们 
先 按照 Oracle 的 要 求 打 补丁 升级 ,不 过 打 过 补丁 之 后 ,故障 并 没有 消失 ,出 现 的 频率 也 未 发 生 任 
何 改变 。 

此 前 , 通过 江苏 的 李 工 我 了 解 到 , 故障 发 生 时 的 现象 是 数据 库 被 挂 住 , 无 法 进行 任何 操作 ( 包 
括 登 录 ) 。 通 过 操作 系统 监控 ， 发 现 总 的 CPU 使 用 率 并 不 高 ， 但 是 总 会 有 一 两 个 CPU 的 使 用 率 
超过 90% ， 甚 至 接近 或 达到 100%。 其 他 的 CPU 都 很 空间 。 该 故障 出 现时 ， 都 伴随 有 死 锁 的 报 
错 。 
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ORA-000060: Deadlock detected. More info in file 
/oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 29184.trc, 


在 伴随 出 现 该 故障 的 同时 ， 会 发 现 大 量 的 ORA-600[KKSSCL-INF-IN1-LOOP] 错 误 信息 。 


Tue Apr 18 13:43:31 2006 

Errors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 7554.trc: 
ORA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-loop], [2500], [666], [713], [1427], 
1427], I1, I] 

Tue Apr 18 13:45:30 2006 

Errors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 10892.trc: 
ORA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-1oop], [2500], [592], [603], [1211], 
1211], bly EH 

Tue Apr 18 13:46:23 2006 

Errors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 10892.trc: 
ORA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-loop], [2500], [592], [603], [1211], 
1211], 1], t] 

Tue Apr 18 13:48:25 2006 

Errors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 8253.trc: 
ORA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-loop], [2500], [424], [454], [909], [909], 
le EH 

Tue Apr 18 13:48:35 2006 

Errors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 11751.trc: 
ORA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-loop], [2500], [424], [454], [909], [909], 
1, El 

Tue Apr 18 13:49:18 2006 

Errors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 8253.trc: 
ORA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-loop], [2500], [424], [454], [909], [909], 
1; dH 


通过 Top 命令 发 现 ， 有 两 个 数据 库 服 务 器 进程 十 分 繁忙 。 如 果 杀 掉 繁 忙 的 数据 库 进程 ， 系 统 
就 会 恢复 正常 。 有 了 时候 ,不 杀 掉 进程 ， 系 统 也 会 自动 恢复 正常 。 经 过 观察 ,被 杀 掉 的 繁忙 进程 就 
是 产生 死 锁 的 进程 。 同 时 系统 中 存在 大 量 等 待 enqueue hash chains 门 锁 的 会 话 。 

Oracle 公司 的 技术 支持 人 员 认 为 这 是 由 于 bug 2235386 引起 的 , 并 且 已 经 打 了 2235386 补丁 。 
打 了 补丁 后 , 仍然 出 现 了 相同 的 故障 ， 并且 故 障 的 频率 并 没有 改变 , 说 明 补丁 2235386 并 不 能 彻 
底 解决 本 故障 。bug 2235386 可 能 只 是 一 个 类 似 的 bug， 也 是 由 于 死 锁 检 测 导 致 系统 被 挂 住 。 我 
最 初 也 怀疑 是 由 该 bug 引起 , 但 是 打 完 补丁 后 问题 仍然 存在 , 说 明 这 个 问题 不 是 那么 简单 ， 这 个 
案例 有 可 能 是 Oracle 尚未 解决 的 bug. 

沈阳 飞 南京 需要 两 个 多 小 时 ， 在 飞机 上 我 认真 阅读 了 bug 2235386 的 资料 。 这 些 资 料 是 我 这 
几 天 从 网 上 下 载 的 ， 关 于 这 个 问题 ， 我 也 已 经 研究 了 个 把 星期 了 ， 除 了 对 bug 2235386 有 了 一 定 
的 认识 外 ， 其 他 方面 还 设 有 什么 头绪 。 由 于 不 知道 死 锁 检测 的 算法 ， 所 以 很 多 方面 只 能 是 猜测 ， 
通过 parent enqueue hash chains 等 待 这 个 情况 来 看 ， 在 死 锁 检测 时 可 能 有 会 话 持 有 了 这 个 门 锁 。 
这 个 父 门 锁 是 获取 锁 资 源 的 核心 , 一 旦 这 个 门 锁 被 占用 ，, 系统 中 所 有 涉及 锁 操作 的 工作 都 必须 等 
待 ， 而 死 锁 检测 是 经 常 性 任务 ， 这 么 频繁 地 持 有 parent enqueue hash chains 显然 对 系统 的 整体 性 
能 有 很 大 的 影响 。Oracle 内 部 实现 死 锁 检测 为 什么 要 持 有 这 个 门 锁 呢 ? 

从 我 手头 找到 的 这 些 资料 来 看 ， 这 个 bug 最 早 发 现 是 在 8.1.7 上 ， 当 时 认为 8.1.7.4 已 经 修复 
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了 这 个 bug, 不 过 后 来 在 9.2.0.1 和 9.2.0.2 上 再 次 被 发 现 , 9.2.0.3 里 包含 了 这 个 补丁 的 修复 , 但 是 
在 9.2.0.3 或 者 更 高 的 版 本 中 又 有 大 量 该 bug 导致 问题 的 报告 。 在 一 份 bug 报告 里 , 我 看 到 了 一 些 
线索 。 死 锁 诊 断 时 ,需要 做 进程 状态 转 储 ， 在 这 之 前 ,会 持 有 parent+children enqueue hash chains 
站 锁 。 这 个 痕 锁 被 持 有 后 ,其 他 的 锁 请 求 就 会 被 全 部 冻结 ， 因 此 如 果 进 程 状态 转 储 的 持续 时 间 比 
较 长 ， 就 可 能 会 使 整个 系统 挂 住 。 

由 于 事情 十 分 紧急 , 所 以 我 一 下 飞机 就 直接 带 着 行李 赶 到 了 客户 现场 , 李 工 已 经 根据 我 们 在 
机 场 沟通 的 方案 , 通过 LogMiner 分 析 了 无 锡 数据 库 5 月 10 日 出 现 故障 的 时 间 段 前 后 1 个 小 时 的 
日 志 , 发 现 26 分 17 秒 到 27 分 56 秒 之 间 没 有 任何 SQL 语句 执行 , 说 明 这 个 期 间 数 据 库 完全 挂 住 
(一 般 情 况 是 发 生 了 内 部 死 锁 或 者 系统 内 部 资源 不 足 造成 的 等 待 某 资 源 释放 ) ,在 23 分 到 26 分 17 
秒 之 间 有 一 个 类 似 DDL 操作 的 迹象 ，5 月 10 H 20:16:10, 产生 了 大 量 内 部 操作 和 对 SEG$ 和 
TsQs 的 操作 。 从 上 述 信息 中 还 无 法 确定 该 操作 和 系统 挂 住 是 否 有 直接 的 联系 。 可 以 确认 的 是 ， 
该 操作 和 上段 扩 展 没 有 关系 。 除 此 之 外 , 在 整个 分 析 时 段 中 没有 有 明显 异常 的 SQL, 另外 一 个 特点 
是 ， 在 ORA-60 挂 起 系统 时 ， 会 伴随 出 现 ORA-600 [kksscl-inf-inl-loop]， 具 体 如 下 : 


Wed Apr 12 12:50:13 2006 
Errors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 5707.trc: 
ORA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-loop], [2500], [259], [259], [520], [520], 
ed Apr 12 12:50:46 2006 
rrors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 20951.trc: 
RA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-loop], [2500], [259], [259], [520], [520], 
ed Apr 12 12:50:57 2006 
rrors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 21001.trc: 
RA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-loop], [2500], [259], [259], [520], [520], 
ed Apr 12 12:55:20 2006 
rrors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz ora 19245.trc: 
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ORA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-loop], [2500], [257], [258], [517], [517], 

Wed Apr 12 12:59:27 2006 

Errors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz_ora 16122.trc: 
ORA-07445: 出 现 异 常 : 核心 转 储 [LE_sym_name()+100] [SIGQUIT] [unknown code] 
[0x5C5E0000006A] [] [] 

ORA-01403: 未 找到 数据 

Wed Apr 12 12:59:34 2006 

Errors in file /oracle/appl/oracle/product/9.2/admin/bsssz/udump/bsssz_ora 20951.trc: 
ORA-07445: 出 现 异常 : Bob [__doprnt_wide()+688] [SIGQUIT] [unknown code] 
[0x5C5E0000006A] [] [] 

ORA-00600: 内 部 错误 代码 ， 参 数 : [kksscl-inf-inl-loop], [2500], [259], [259], [520], [520], [], [] 
Wed Apr 12 13:00:02 2006 

ORA-000060: Deadlock detected. More info in file /oracle/appl/oracle/product/9.2/ 


admin/bsssz/udump/bsssz ora 16116.trc. 

通过 分 析 这 个 错误 日 志 , 初步 感觉 这 个 错误 可 能 不 是 导致 问题 的 原因 ， 因 为 这 个 错误 是 由 于 
SQL 分 析 时 等 待 子 游标 。 等 待 子 游标 的 父 游标 都 有 或 多 或 少 的 子 游标 ， 多 的 有 200 ~ 300 个 子 游 
bs, INA S~ 10 个 子 游 标 。 关 于 这 个 问题 我 和 李 工 进行 过 多 次 讨论 ,我 又 查阅 了 大 量 资料 ， 初 
步 的 结论 是 这 个 故障 可 能 是 由 于 系统 挂 住 引起 的 而 不 是 导致 系统 挂 住 的 原因 。 

第 二 次 发 生 故障 时 临近 下 班 ， 由 于 业务 量 不 大 ,所 以 我 和 李 工 决定 稍微 等 一 下 ， 暂 时 不 杀 掉 
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会 话 。 等 了 大 概 五 六 分 钟 ， 系 统 挂 住 的 状态 还 是 没有 改变 ， 我 和 李 工 沟通 后 决定 做 一 个 kill-3 操 
VE. 该 操作 给 我 们 提供 了 一 个 有 趣 的 信息 ， 也 最 终 为 找到 问题 原因 提供 了 最 有 利 的 数据 。 有 趣 的 
是 kill-3 不 能 停止 该 死 锁 进程 的 操作 ， 不 过 能 在 日 志 中 看 到 该 Kill 操作 被 该 进程 捕获 ， 说 明 该 进 
程 并 没有 死 或 者 伪 死 ， 还 在 做 转 储 操作 。 

通过 该 进程 的 跟踪 开始 时 间 和 捕获 到 kill-3 操作 的 时 间 可 以 看 出 ， 该 进程 写 Trace 文件 已 经 
超过 10 分 钟 了 ， 还 没有 完成 。 是 什么 原因 导致 一 个 几 兆 字 节 的 Trace 文件 10 多 分 钟 还 没有 完成 
WE? 很 明显 ， 这 个 时 候 出 现 了 内 部 死 锁 ， 而 什么 原因 会 产生 内 部 死 锁 呢 ? 通过 跟踪 ， 我 们 看 到 ， 
Trace 文件 里 的 会 话 持 有 了 parent enqueue hash chains， 这 个 门 锁 在 写 Trace 文件 时 一 直 没 有 释放 ， 
而 parent enqueue hash chains 正 是 可 能 导致 系统 挂 住 的 一 个 门 锁 ， 因 此 可 以 判断 系统 挂 住 的 主要 
原因 是 由 于 parenet enqueue hash chains 门 锁 被 持 有 ， 而 持 有 该 门 锁 的 会 话 又 由 于 写 Trace 文件 十 
分 缓慢 而 很 久 都 没有 释放 该 门 锁 。 

似乎 问题 的 原因 找到 了 ， 但 是 为 什么 写 ORA-60 Trace 时 会 持 有 parent enqueue hash chains 门 
锁 呢 ?ORA-60 Trace 为 什么 会 这 么 久 都 没有 写 完 呢 ?只 有 搞 明白 了 这 一 点 ,才能 够 真正 找到 解决 
这 个 问题 的 方法 。 

看 样子 有 必要 深入 分 析 一 下 Oracle 死 锁 处 理 的 算法 了 ， 只 有 通过 算法 才能 搞 明 白 这 几 个 问 
题 。 要 了 解 算 法 ， 看 样子 又 要 用 我 整 脚 的 英语 去 和 远 在 美国 的 John 交流 了 。 虽 然 用 英语 表达 对 
于 我 来 说 很 痛苦 ,但 是 和 John 的 交流 还 是 很 愉快 的 , 每 次 都 会 带 给 我 不 少 的 收获 。 现 在 是 晚上 8 
点 多 钟 ，John 可 能 正在 上 班 的 路 上 , 还 是 等 明天 白天 再 和 他 联络 吧 。 不 过 如 果 现 在 发 一 个 邮件 给 
他 ， 也 许 明 天 我 醒 来 时 ， 已 经 有 一 份 答案 在 我 的 邮箱 里 了 。 

回 到 酒店 时 已 经 是 晚上 10 点 多 了 ， 通 过 Skype 和 老 能 、 老 于 通 了 通话 ， 他 们 那 边 一 切 都 很 
顺利 。 和 我 想象 的 一 样 ， 老 能 和 老 于 有 一 种 一 见 如 故 的 感觉 当然 晚上 也 一 起 喝 了 点 白酒 。 下 午 
到 达 现 场 后 ， 老 能 已 经 开始 着 手 分 析 那 个 我 认为 最 为 棘手 的 SQL 了 。 在 机 场 的 时 候 我 建议 老 能 
先 看 看 别 的 SQL, 刚 上 来 就 哨 硬 骨头 ， 蹦 了 和 牙 就 不 好 玩 了 。 我 做 项 目 有 个 习惯 ,一般 来 说 先 从 容 
DAF, 一 方面 可 以 很 快 获得 一 些 成 果 ，, 给 客户 一 定 的 信心 ,一 方面 也 是 偷懒 ,希望 不 用 动 最 
难 的 部 分 ， 就 能 够 达成 优化 的 目的 。 老 能 的 态度 很 明确 ， 这 个 系统 如 果 不 解决 几 个 主要 的 SQL, 
优化 效果 是 要 打折 扣 的 ,早晚 要 碰 ， 还 不 如 现在 趁 着 刚刚 加 入 体力 好 、 心 里 负担 轻 时 先 搞 ， 否 则 
过 段 时 间 ， 随 着 意志 消磨 ， 可 能 连 碰 这 些 SQL 的 心思 都 没有 了 。 

既然 有 老 熊 这 种 好 同志 在 前 方 这 么 玩命 , 我 也 可 以 安心 地 完成 江苏 的 工作 , 不 用 急 着 赶 回 沈 
HT. 今天 看 样子 能 睡 个 好 觉 了 。 


















































oM 今日 点 评 

今天 涉及 的 问题 属于 比较 深入 的 问题 ， 对 于 初级 DBA 来 说 就 当 看 个 故事 吧 。 要 想 解 决 类 似 
今天 的 问题 ， 需 要 深入 了 解 Oracle 内 部 的 一 些 算法 ， 这 也 是 很 多 DBA 梦 宁 以 求 的 事情 。 不 过 这 
些 算 法 涉及 Oracle 公司 的 核心 机 密 ， 因 此 也 很 难 获取 到 。 不 过 从 Metalink 上 的 一 些 Oracle 内 部 
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文档 (标识 为 internal only 的 文档 ) , 我 们 可 以 从 只 言 片 语 中 获得 一 些 信 息 , 将 这 些 算法 还 原 出 来 。 
在 写本 书 的 同时 ， 老 白 也 在 粉丝 网 上 发 了 一 些 帖 子 , 介绍 过 一 些 算法 , 大 家 有 兴趣 的 话 可 以 去 查 
阅 。 

了 解 这 些 内 容 的 方法 无 外 平 几 个 途径 。 第 一 是 更 为 深入 地 阅读 Oracle Concepts, 从 这 本 书 里 
其 实 可 以 学 到 很 多 Oracle 的 基本 思想 和 概念 , 勤奋 的 人 也 可 以 从 中 猜测 出 一 些 算法 的 思路 。 第 二 
是 通过 DSI 培训 教材 来 了 解 Oracle 内 部 的 原理 ，DSI 是 Oracle 内 部 培训 教材 ， 不 过 现在 大 量 的 
DSI 教 材 已 经 流传 出 来 了 ， 特 别 是 基于 Oracle 9i 的 DSI 4xx 系列 ， 使 用 Google 去 搜索 一 下 “DSI 
Oracle" ， 应 该 能 找到 不 少 资 料 。 第 三 条 途径 是 通过 一 些 Oracle 内 部 文档 (标识 为 internal only 的 
文档 ) ， 这 部 分 文档 比 DSI 更 难 找到 ， 不 过 有 心 人 还 是 会 有 所 发 现 的 。 其 实在 老 白 的 Oracle 粉丝 
网 上 就 能 找到 不 少 这 种 文档 。 

国外 几 个 网 站 上 也 有 不 少 可 以 了 解 Oracle 内 部 原理 的 资料 ,比如 最 为 著名 的 Pttp:/www.ixora. 
com.au 网 站 ， 这 个 网 站 上 的 资料 虽然 旧 一 些 ,， 不 过 确实 都 是 很 经 典 的 。 另 外 asktom.oracle.com 也 
是 一 个 很 好 的 网 站 ， 有 些 不 明白 的 地 方 ， 和 Tom 大 师 " 聊 聊 ， 也 许 会 有 收获 。 


E" 3 优化 小 技巧 ) Oracle 的 死 锁 


死 锁 处 理 是 Oracle 锁 处 理 机 制 中 的 一 个 亮点 。 一般 来 说 死 锁 是 很 难 避 免 的 , 除非 在 应 用 访问 
数据 时 做 了 十 分 严格 的 定义 ， 对 事务 访问 的 数据 源 进 行 分 级 按照 级 别 进行 访问 。 由 于 在 应 用 开 
发 时 避免 死 锁 十 分 困难 ， 所 以 绝 大 多 数 应 用 都 是 依靠 Oracle 的 死 锁 处 理 机 制 来 处 理 死 锁 。Oracle 
会 自动 进行 死 锁 检 测 ， 一 旦 发 现 死 锁 后 ， 自 动 解 开 。 应 用 程序 可 能 会 碰 到 一 个 ORA-60 的 错误 信 
息 ， 那 就 是 Oracle 的 死 锁 检测 机 制 起 作用 了 。 

在 RAC 环境 下 ， 需 要 做 全 局 的 死 锁 检测 ， 由 LMD 进程 负责 死 锁 检测 。LMD 进程 检测 死 锁 
的 周期 由 参数 _lm_gq_interval 确定 ， 这 个 参数 的 默认 值 是 60s (大 多 数 平台 下 )。 

分 析 ORA-60 Trace 文件 时 ， 主 要 是 检查 WFG (Wait-For-Graph， 等 待 图 )。 针 对 全 局 死 锁 ， 

局 部 WFG 的 格式 如 下 : 


Global Wait-For-Graph (WFG) at ddTS[0.1] : 





















































BLOCKED c000000007a2fcd8 5 [Oxf002a] [Ox4bf], [TX] [65553,2] 0 
BLOCKER c00000004ba2b090 5 [0xf002a] [Ox4bf], [TX] [131089,2] 1 
BLOCKED c00000004ba2b4b0 5 [0x70022][0x589],[TX] [131089,2] 1 
BLOCKER c000000007930470 5 [0x70022][0x589],[TX] [65553,2] 0 


其 中 第 一 列 列 出 了 阻塞 者 (BLOCKER) 和 被 阻塞 者 (BLOCKED), ， 第 二 列 是 锁 的 地 址 指针 ， 
第 三 列 是 锁 的 模式 ， 第 四 列 是 资源 的 ID 及 名 字 ， 第 五 列 的 含义 是 <pidldialtxn_id>， 可 能 是 
PID， 也 可 能 是 进程 事务 号 ， 最 后 一 列 是 RAC 节点 的 ID，0 代表 一 号 节点 ，1 代表 二 号 节点 。 

锁 模 式 的 取 值 及 含义 说 明 如 下 。 

a 0; NULL, 














Q 指 Tom Kyte, 
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a 1: 并 发 读 (SS), 
a 2: 并 发 写 (SX)。 
a 3: 保护 读 (S)。 

a 4; 保护 写 (SSX)。 
a 5: 排他 访问 (X)。 


Deadlock graph: 








--------- Blocker(s)--------  ---------Waiter (s) 
Resource Name process session holds waits process session holds waits 
TX-00020012-0000025e 12 11 X 11 10 
TX-00050013-0000003b 11 10 X 12 11 
session 11: DID 0001-000C-00000001 session 10: DID 0001-000B-00000001 
session 10: DID 0001-000B-00000001 session 11: DID 0001-000C-00000001 


Rows waited on: 
Session 10: obj - ROWID = 00000BF6 - AAAAv2AAEAAAAqKAAB 
Session 11: obj - ROWID - 00000BF6 - AAAAv2AAEAAAAqKAAA 


FSM) 几 个 常用 的 与 锁 相关 的 脚本 


i 本 市 将 介绍 一 些 Metalink 上 十 分 有 用 的 锁 使 用 情况 ， 供 大 家 参考 。 
. 会 话 锁 使 用 情况 
使 用 会 话 锁 时 ， 其 查询 语句 如 下 : 


set linesize 200 feedback off heading on 
column sid format 999 
column res heading 'Resource Type' format a20 
column idl format 9999999 
column id2 format 9999999 
column lmode heading 'Lock Held' format a14 
column request heading 'Lock Req.' format al4 
column serial# format 99999 
column username format a10 
column terminal heading Term format a6 
column tab format a10 
column owner format a8 
SELECT 1.sid,s.serial#,s.username,s.terminal, 
decode(l.type,'RW','RW - Row Wait Enqueue', 
'TM', 'TM — DML Enqueue', 
'TX', 'TX - Trans Enqueue', 
'UL','UL - User',l.type||'System') res, 
substr(t.name,1,10) tab,u.name owner, 
l,idl,l,.ig2, 
decode(1l.l1mode,1,'No Lock', 
2,'Row Share', 
,'Row Exclusive', 
,'Share', 
,'Shr Row Excl', 
,'Exclusive',null) Imode, 





OY Ul i mW 


对 于 普通 的 WFG， 其 格式 和 局 部 WFG 略 有 不 同 ， 不 过 其 定义 比较 清晰 。 下 面 是 一 个 例子 : 
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decode(l.request,1,'No Lock', 
2,'Row Share', 
3,'Row Excl', 
4,'Share', 
5, 'Shr Row Excl', 
6,'Exclusive',null) request 
FROM v$lock 1, v$session s, 
sys.user$ u,sys.obj$ t 
WHERE l.sid - s.sid 
AND s.type !- 'BACKGROUND' 
AND t.obj# = l.id1 
AND u.user# = t.owner# 
/ 
set feedback on 


2. 详细 分 解锁 的 情况 
详细 分 解锁 时 ， 其 查询 语句 如 下 : 


set lines 200 

set pagesize 66 

spool locks.lis 

break on Kill on sid on username on terminal 
column Kill heading 'Kill String' format a13 
column res heading 'Resource Type' format 999 
column idl format 9999990 

column id2 format 9999990 

column locking heading 'Lock Held/Lock Requested' 
column lmode heading 'Lock Held' format a20 
column request heading 'Lock Requested' format a20 
column serials format 99999 

column username format al0 heading "Username" 
column terminal heading Term format a6 

column tab format a30 heading "Table Name" 

column owner format a9 

column LAddr heading "ID1 - ID2" format a18 
column Lockt heading "Lock Type" format a40 
column command format a25 

column sid format 990 





rem L.SID||','||S.SERIAL# Kill, 

SELECT 

nvl(S.USERNAME, 'Internal') username, 
L.SID, 


nvl(S.TERMINAL,'None') terminal, 
decode (command, 


0,'None',decode(1.id2,0,U1.NAME||'.'||substr(T1.NAME,1,20),'None')) tab, 


decode (command, 
0, ' BACKGROUND ' , 
1,'Create Table', 
2,'INSERT', 
3,'SELECT', 
4,'CREATE CLUSTER', 
5,'ALTER CLUSTER', 
6,'UPDATE', 


format a40 
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7,'DELETE', 
B,'DROP', 
9,'CREATE INDEX', 
10,'DROP INDEX', 
11,'ALTER INDEX', 
12,'DROP TABLE', 
HRe 

14, "sae", 
15,'ALTER TABLE', 
16, ee", 
17,'GRANT', 

18, 'REVOKE', 

19, 'CREATE SYNONYM', 
20,'DROP SYNONYM', 
21, 'CREATE VIEW', 
22,'DROP VIEW', 
23 Sees 

242, =al; 

25%" E 


26,'LOCK TABLE', 
27,'NO OPERATION', 


28,'RENAME', 
29,'COMMENT', 
30,'AUDIT', 


31,'NOAUDIT', 
32,'CREATE EXTERNAL DATABASE', 
33,'DROP EXTERNAL DATABASE', 
34,'CREATE DATABASE', 
35,'ALTER DATABASE', 
36,'CREATE ROLLBACK SEGMENT', 
37,' ALTER ROLLBACK SEGMENT', 
38,'DROP ROLLBACK SEGMENT', 
39,'CREATE TABLESPACE', 
40,'ALTER TABLESPACE', 
,'DROP TABLESPACE', 

A 

A 





LTER SESSION', 














1 

2 

i LTER USER', 
4,'COMMIT', 
5 

6 

7 

8 





,'ROLLBACK', 

, 'SAVEPOINT', 

,'PL/SQL EXECUTE', 
,'SET TRANSACTION', 
49,'ALTER SYSTEM SWITCH LOG', 
50,'EXPLAIN', 

51,'CREATE USER', 
52,'CREATE ROLE', 
53,'DROP USER', 

54,'DROP ROLE', 

55,'SET ROLE', 

56,'CREATE SCHEMA', 
57,'CREATE CONTROL FILE', 
58,'ALTER TRACING', 
59,'CREATE TRIGGER', 
60,'ALTER TRIGGER', 








5H19H 南京 的 死 锁 问题 


57 





61,'DROP TRIGGER', 

62,'ANALYZE TABLE', 

63,'ANALYZE INDEX', 

64,'ANALYZE CLUSTER', 

65,'CREATE PROFILE', 

66,'DROP PROFILE', 

67,'ALTER PROFILE', 

68,'DROP PROCEDURE', 

70,'ALTER RESOURCE COST', 

71,'CREATE SNAPSHOT LOG', 

72,'ALTER SNAPSHOT LOG', 

73,'DROP SNAPSHOT LOG', 

74,'CREATE SNAPSHOT', 

75,'ALTER SNAPSHOT', 

76,'DROP SNAPSHOT', 

84,'-', 

85, 'TRUNCATE TABLE', 

86, 'TRUNCATE CLUSTER', 

BT tay 

88, 'ALTER VIEW', 

89, 2t; 

90, "—*; 

91,'CREATE FUNCTION', 

92,'ALTER FUNCTION', 

93,'DROP FUNCTION', 

94,'CREATE PACKAGE', 

95,'ALTER PACKAGE', 

96,'DROP PACKAGE', 

97,'CREATE PACKAGE BODY', 

98,'ALTER PACKAGE BODY', 

99,'DROP PACKAGE BODY', 

command||' - ???') COMMAND, 

decode (L.LMODE,1,'No Lock', 

2,'Row Share', 
3,'Row Exclusive', 

4,'Share', 

5 

6 





























,'Share Row Exclusive', 
,'Exclusive',' 'NONE' ) 
decode (L.REQUEST,1,'No Lock', 
2,'Row Share', 
3, 'Row Exclusive’, 
4,'Share', 
5,'Share Row Exclusive’, 
6, 'Exclusive', 'NONE') 
l.idi||'-'||i.id2 Laddr, 
l.type||' = "|| 
decode (1.type, 
'BL','Buffer hash table instance lock', 


'CF','Cross-instance function invocation 
'CI','Control file schema global enqueue 
'CS','Control file schema global enqueue 
'DF','Data file instance lock', 

'DM','Mount/startup db primary/secondary 
'DR','Distributed recovery process lock', 


lmode, 


request, 


instance lock', 
lock', 
lock', 


instance lock', 
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'DX','Distributed transaction entry lock', 
'FI','SGA open-file information lock', 
'FS','File set lock', 

'IR','Instance recovery serialization global enqueue lock', 
'IV','Library cache invalidation instance lock', 
'MB','Master buffer hash table instance lock', 
'MM','Mount definition gloabal enqueue lock', 
'MR','Media recovery lock', 
'RE','USE ROW ENQUEUE enforcement lock', 
'RT','Redo thread global enqueue lock', 
'RW','Row wait enqueue lock', 

'SC','System commit number instance lock', 
'SH','System commit number high water mark enqueue lock', 
'SN','Sequence number instance lock', 
'SQ','Sequence number enqueue lock', 

'ST','Space transaction enqueue lock', 
'SV','Sequence number value lock', 

'TA','Generic enqueue lock', 

'TD', 'DDL enqueue lock', 

'TE', 'Extend-segment enqueue lock', 

'"TM','DML enqueue lock', 

'TT', 'Temporary table enqueue lock', 

'TX', 'Transaction enqueue lock', 

'UL','User supplied lock', 

'UN','User name lock', 

'WL','Being-written redo log instance lock', 











'WS','Write-atomic-log-switch global enqueue lock', 
'TS',decode(l.id2,0,'Temporary segment enqueue lock (ID2=0)' 
'New block allocation enqueue lock (ID2- 1)'). 
'LA','Library cache lock instance lock (A-namespace)', 
'LB','Library cache lock instance lock (B-namespace)', 
'LC','Library cache lock instance lock (C-namespace)', 
'LD','Library cache lock instance lock (D-namespace)', 
'LE','Library cache lock instance lock (E-namespace)', 
'LF','Library cache lock instance lock (F-namespace)', 
'LG','Library cache lock instance lock (G-namespace)', 
'LH','Library cache lock instance lock (H-namespace)', 
'LI','Library cache lock instance lock (I-namespace)', 
'LJ','Library cache lock instance lock (J-namespace)', 
'LK', 'Library cache lock instance lock (K-namespace)', 
'LL','Library cache lock instance lock (L-namespace)', 
'LM','Library cache lock instance lock (M-namespace)', 
'LN','Library cache lock instance lock (N-namespace)', 
'LO','Library cache lock instance lock (O-namespace)', 
'LP','Library cache lock instance lock (P-namespace)', 
'LS','Log start/log switch enqueue lock', 
'PA','Library cache pin instance lock (A-namespace)', 
'PB','Library cache pin instance lock (B-namespace)', 
'PC','Library cache pin instance lock (C-namespace)', 
'PD','Library cache pin instance lock (D-namespace)', 
'PE','Library cache pin instance lock (E-namespace)', 
'PF', 'Library cache pin instance lock (F-namespace)', 
'PG','Library cache pin instance lock (G=namespace) ', 
'PH','Library cache pin instance lock (H-namespace)', 
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operations on temporary tbl', 


Number ' 
State' 
Kick', 


Slaves' 


Direct Loader Index Creation' 
Instance 
Instance 
Redo Log 
Password File' 
Parallel 
Process Startup' 
,'Parallel Slave Synchronization' 
'Temporary Segment 


I-namespace 
J-namespace 
K-namespace 
L-namespace 
M-namespace 
N-namespace 
O-namespace 
P-namespace 
Q-namespace 
R-namespace 
S-namespace 
T-namespace 
U-namespace 
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' 
1 


' 
, 


' 
D 


' 
次 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 
' 


(also TableSpace)', 


) 
) 
) 
) 
) 
) 
) 
) 
) 
) 
) 
) 
) 
) 
) 
) 
) 
) 
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'RO','Multiple object resue', 

'????') Lockt 

FROM VSLOCK L, 
VSSESSION S, 
SYS.USERS U1, 
SYS.OBJS T1 

WHERE L.SID = S.SID 


AND T1.OBJ# = decode(L.ID2,0,L.ID1,1) 
AND U1.USER# = T1.OWNER# 
AND S.TYPE != 'BACKGROUND' 


ORDER BY 1,2,5 
/ 


5 


5 月 208 À 凌晨 的 邮件 通知 短信 


昨天 睡觉 时 忘记 关 手 机 了 。 我 们 的 外 国 同行 一 般 都 会 使 用 两 个 手机 号 码 , 下 班 后 就 关闭 工作 
号 码 ， 认 真 地 享受 生活 了 。 在 国内 就 完全 不 一 样 了 ,做 服务 的 人 ， 手 机 基本 上 是 不 能 关机 的 。 以 
前 公司 人 少 的 时 候 ， 我 和 老 能 两 个 人 如 果 都 要 从 深圳 飞 北 京 ， 就 要 分 坐 两 个 航班 ， 等 老 能 到 达 目 
的 地 了 ,我 再 出 发 ， 这 样 无 论 如 何 客户 都 能 找到 我 们 中 的 一 个 。 我 们 几 个 人 安排 了 值班 制度 ， 轮 
到 值班 时 ， 会 把 服务 热线 转 到 值班 人 员 的 手机 上 ， 这 时 这 个 人 的 手机 就 必须 24 小 时 开机 。 这 个 
月 不 是 我 值班 ， 按 理 说 是 可 以 关 手机 的 ， 由 于 10 点 多 才 匆 匆 住 下 ， 睡 觉 前 居然 忘记 了 。 其 实 我 
关机 的 时 候 很 少 ， 哪 怕 是 不 值班 的 时 候 ， 一 般 也 是 24 小 时 开 着 的 。 只 有 在 长 途 旅 行 后 或 者 加 夜 
班 后 才 会 关闭 手机 ， 以 保证 睡眠 。 

这 几 天 没有 好 好 休息 ， 在 飞机 上 又 看 了 半天 文件 ， 所 以 晚上 不 到 11 : 00 我 就 睡 了 。 半 夜 ， 
正在 睡梦 中 的 我 被 一 阵 手 机 铃声 惊醒 ， 第 一 时 间 我 就 觉得 是 John 回信 了 ， 急 忙 拿 起 放 在 床 头 的 
手机 。 一 看 ， 却 是 一 个 房地产 广告 :“ 万 科 东 方 尊 峪 ， 超 低 价 发 售 ，9999 起 。” 我 失望 地 放下 手 
机 ， 正 准备 躺 下 ， 手 机 铃声 再 次 响起 ， 可 恶 的 房产 广告 ， 可 恶 的 万 科 ， 我 正 准备 拘 掉 铃 声 ， 突 然 
发 现 这 是 我 邮箱 的 邮件 通知 短信 。 

John 真是 个 好 同志 ， 自 从 离开 Oracle 公司 后 ，John 成 为 一 家 银行 的 DBA 经 理 ， 空 闲 的 时 间 
比 在 Oracle 时 多 了 很 多 。 用 他 的 话说 ， 从 一 个 救火 队员 变 成 了 一 个 悠闲 的 海滨 度假 者 ， 从 40 岁 
开始 ， 他 要 开始 享受 生活 了 ， 带 小 孩 周游 列国 和 为 报纸 撰写 社评 将 成 为 他 的 主要 工作 。 我 曾经 为 
此 嘲笑 他 说 , 周游 列国 我 相信 , 写 社评 我 绝对 不 信 , 顶 多 也 就 给 Oracle 技术 通信 写 几 个 客户 来 稿 。 
不 过 自从 他 离开 Oracle 公司 后 ， 由 于 闲暇 时 间 比 较 多 ，John 回答 我 的 问题 也 越 来 越 及 时 。 我 已 
经 有 一 个 多 月 没 和 他 联络 过 了 ， 估 计 这 哥们 也 早 就 心里 痒痒 了 。 对 John 来 说 ， 有 Oracle 方面 的 
难题 给 他 ， 是 最 愉快 的 事情 。 

放下 手机 ， 我 马上 打开 正在 待机 的 电脑 ， 查 看 John 的 邮件 。John 的 回答 很 短 ， 显 然 是 在 匆 
忙中 写 的 ， 翻 译 成 中 文 就 是 :“ 死 锁 引 起 数据 库 挂 住 是 一 个 老 问题 ， 开 发 人 员 已 经 起 码 处 理 了 几 
年 , 但 是 还 有 很 多 bug 没有 解决 。 死 锁 检 测 的 简要 过 程 在 文档 285270.1 中 说 得 很 清楚 ( 见 附件 )， 
你 应 该 一 看 就 明白 了 。 其 关键 原因 是 写 Trace 的 时 候 , 需要 进行 进程 状态 转 储 , 而 转 储 完成 之 前 ， 
持 有 的 parent enqueue hash chains 门 锁 是 不 释放 的 ， 因 为 死 锁 检测 过 程 必须 判定 哪些 资源 的 等 待 
状态 没有 发 生 改变 , 才 会 对 这 些 没 有 发 生 改变 的 资源 进行 检查 , 否则 检查 面 就 太 广 了 。 持 有 parent 


enqueue hash chains 是 这 个 问题 的 关键 。” 
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在 Metalink 文档 285270.1 里 对 死 锁 检测 做 了 一 个 简要 的 介绍 ， 看 过 这 份 文档 ， 再 参考 John 
的 提示 ， 仔 细 想 想 ， 在 做 死 锁 检测 的 时 候 ， 确 实 是 必须 持 有 parent enqueue hash chains 门 锁 的 ， 
因为 死 锁 检测 (DLD, DeadLock Detection) 需要 通过 对 每 个 资源 做 一 个 检查 ， 才 可 能 发 现 哪些 
资源 出 现 了 死 锁 。 而 如 果 对 每 个 资源 都 进行 一 次 死 锁 检查 ， 那 么 开销 就 太 大 了 ， 因 为 在 一 个 大 型 
系统 中 同时 有 几 十 万 甚至 上 百 万 个 资源 都 是 很 正常 的 。 每 个 资源 上 面 都 有 三 条 链 : 一 条 是 持 有 者 
链 ， 链 接 了 所 有 持 有 这 个 资源 的 锁 的 情况 ;一 条 是 等 待 转换 状态 链 ， 链 接 了 所 有 等 待 转换 锁 状 态 
的 请 求 , 还 有 一 条 是 等 待 锁定 链 , 链接 了 所 有 等 待 锁 的 请 求 。 如 果 不 出 现 死 锁 ， 那么 这 三 条 链 和 
资源 的 状态 在 很 短 的 时 间 内 肯定 会 发 生变 化 , 而 死 锁 出 现时 , 相关 的 资源 肯定 在 很 长 时 间 里 都 不 
会 发 生变 化 。 因 此 在 检测 死 锁 时 ， 只 需要 对 那些 从 上 回 检查 后 状态 一 直 没 有 发 生 过 变化 的 资源 进 
行 检查 就 可 以 发 现 死 锁 了 。 为 了 获取 这 些 数据 的 一 致 性 视图 , 在 做 死 锁 检测 时 就 必须 持 有 这 个 门 
锁 。 死 锁 检 测 本 身 很 快 ， 所 以 一 般 情 况 下 不 会 引起 问题 。 不 过 ， 如 果 出 现 了 死 锁 ， 要 做 死 锁 情况 
转 储 时 就 可 能 会 出 问题 。 系 统 状态 转 储 或 者 进程 状态 转 储 被 挂 住 的 可 能 性 也 是 存在 的 , 这 很 可 能 
是 由 于 另外 一 个 bug 引起 的 ， 无 论 哪个 bug， 关 闭 转 储 应 该 可 以 解决 问题 。 由 于 在 进程 状态 转 储 
时 ， 死 锁 检 测 会 话 会 持 有 parent enqueue hash chains 父 门 锁 ， 所 以 在 这 个 时 候 ， 任 何 需 要 申请 锁 
资源 (包括 内 部 锁 ) 的 操作 都 需要 等 待 。 由 于 游标 分 析 需 要 申请 library cache lock， 所 以 在 这 种 
情况 下 ， 游 标 分 析 无 法 进行 。 部 分 会 话 会 报 ORA-600[kksscl-inf-inl-loop] 故 障 。 

看 看 手机 ， 已 经 是 早上 6 点 多 钟 ， 澳 大 利 亚 已 经 是 早上 8 ALT, Ben 可 能 已 经 起 床 。Ben 
有 早上 上 网 阅读 早 新 闻 的 习惯 , 希望 能 碰 到 他 ， 和 他 聊 聊 这 个 问题 。 打 开 Yahoo Pager, 发 现 Ben 
BAET. Ben 听 了 问题 的 叙述 后 ， 也 立即 说 这 是 Oracle 的 一 个 顽疾 ， 虽然 出 了 很 多 补丁 , 但 
是 还 有 一 些 问题 没有 解决 。Ben 在 Oracle 工作 快 10 年 了 ， 作 为 澳洲 Oracle 的 救火 队员 ， 他 处 理 
过 10 多 个 类 似 的 案例 ， 因 此 他 十 分 肯定 地 说 我 的 猜测 是 对 的 。 同 时 ， 我 从 Ben 那里 拿 到 了 一 分 
KF bug 2235386 的 资料 ， 这 份 资 料 比 我 在 Metalink 上 看 到 的 要 详细 得 多 。 从 中 ， 我 有 了 十 分 惊 
人 的 发 现 。 

bug 2235386 里 面 详细 介绍 了 ORA-60 导致 系统 挂 住 的 情况 ， 里面 的 内 容 与 我 和 John 的 想法 
基本 一 致 ， 但 是 patch 2235386 并 没有 解决 这 个 问题 。 要 解决 这 个 问题 ， 需 要 在 做 进程 状态 转 储 
之 前 最 好 释放 门 锁 , 而 这 是 不 可 能 的 ,因为 这 样 会 导致 进程 状态 转 储 或 者 系统 状态 转 储 的 信息 不 
准确 。 因 此 在 这 个 补丁 里 引入 了 10027 和 10028 两 个 事件 , 通过 设置 这 两 个 事件 来 开启 或 关闭 进 
程 状态 转 储 或 者 系统 状态 转 储 。 原 来 如 此 ,patch 2235386 并 不 能 解决 问题 , 而 仅仅 提供 了 解决 问 
题 的 方法 ， 因 此 Oracle 的 工程 师 仅 仅 是 打 了 补丁 ， 而 没有 解决 问题 ， 必 须 打 完 补丁 后 ， 通 过 设置 
10028 事件 关闭 系统 状态 转 储 ， 才 能 解决 这 个 问题 。 在 死 锁 出 现时 ， 进 程 状 态 转 储 对 于 客户 来 说 
是 没有 多 大 用 途 的 ， 因 此 关闭 后 对 客户 分 析 问 题 影响 不 大 。 

忙 完 这 些 已 经 快 9 AT, 虽然 昨 晚 一 夜 没 怎么 睡 , 不 过 现在 一 点 都 没有 觉得 困 。 上 午 一 上 班 ， 
我 就 和 李 工 通 了 电话 ， 在 电话 里 ， 把 我 的 发 现 和 他 进行 了 沟通 。 李 工 也 基本 认同 了 我 的 分 析 ， 决 
定 先 找 一 个 本 地 网 来 做 做 实验 , 如 果 能 够 解决 问题 , 再 全 面 推广 。 原本 定 于 今天 下 午 的 关于 RAC 
的 交流 ， 由 于 他 们 有 事 ， 押 到 明天 进行 。 看 样子 今天 可 以 休息 一 下 了 。 
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和 李 工 通过 电话 ， 绷 得 很 紧 的 神经 松 好 了 下 来 ， 困 意 也 就 上 来 了 ， 倒 头 睡 了 个 把 小 时 就 被 打 
扫 房 间 的 服务 员 吵 醒 了 。 愤怒 地 赶 走 了 服务 员 后 ,发 现 再 也 无 法 入 睡 , 于 是 只 好 起 来 ， 到 丰富 路 
的 巷子 里 买 了 大 人 饼 卷 油 条 吃 了 ， 然 后 随便 到 街 上 和 逛 逛 。 南 京 不 比 苏 州 、 上 海 ， 吃 的 方面 没有 那么 
精细 , 早餐 一 般 还 是 传统 的 那儿 样 东西 ， 大 饼 卷 油条 是 南京 的 传统 早餐 ， 有 点 类 似 于 北方 的 前 饼 
果子 ， 不 过 大 饼 不 是 摊 出 来 的 ， 而 是 油 前 的 ， 吃 起 来 比较 有 鄙 头 。 


X spa 


今天 老 白 通过 美国 的 John 和 澳大利亚 的 Ben 来 帮助 查找 一 些 资料 。 他 们 两 个 往往 能 够 找到 
老 白 在 国内 很 难 拿 到 的 资料 。 做 DBA 的 ， 多 交 儿 个 这 样 的 朋友 是 十 分 必要 的 ， 其 实 可 以 通过 在 
国外 的 论坛 、OTN 网 站 、Metalink 网 站 等 渠道 , 认识 一 些 老外 , 通过 技术 交流 , 大 家 建立 起 联系 。 
条 件 成 熟 了 ， 就 可 以 通过 MSN, Yahoo Pager 等 工具 直接 进行 交流 了 。 老 白 还 碰 到 过 一 个 DBA, 
这 个 DBA 为 了 扩大 交流 的 圈子 ， 还 花 钱 申请 了 一 个 OUG (Oracle 用 户 组 织 ， 付 费用 户 可 以 获得 
更 多 的 服务 ) 的 账号 。 

另外 一 个 需要 注意 的 方面 是 ，DBA 可 能 经 常会 碰 到 一 些 特殊 的 情况 ， 客 户 需 要 你 给 出 一 个 
合理 的 解释 。 比 如 说 在 这 个 案例 里 ， 很 多 现象 纠缠 在 一 起 ， 必 须 做 出 一 个 十 分 合理 的 解释 。 今 天 
老 白 根据 死 锁 检 测 的 一 些 内 部 原理 对 伴随 出 现 的 ORA-600 [kksscl-inf-inl-loop] 做 出 了 合理 的 解 
释 。 这 些 解 释 需 要 对 理论 相当 了 解 。 由 于 很 多 Oracle 的 内 部 原理 和 机 制 是 不 对 外 公开 的 ,所 以 经 
常会 碰 到 一 些 你 很 难 解释 的 情况 。 碰 到 这 种 问题 时 ， 如果 你 无 法 做 出 合理 的 解释 ,那么 千 万 不 要 
勉强 自己 去 解释 什么 ， 否则 最 终 你 可 能 在 挑战 客户 的 智商 ,很 难 自圆其说 , 让 自己 下 不 了 台 ， 有 
过 几 次 这 样 的 经 历 后 ， 客 户 对 你 的 信任 程度 就 会 大 大 下 降 。 


Shit) 10027/10028 事件 


由 于 死 锁 检 测 时 会 锁 住 parent enqueue latch 并 且 会 进行 进程 状态 转 储 ， 所 以 对 于 大 型 系统 ， 
包含 状态 对 象 比较 多 的 情况 下 ， 这 个 转 储 工作 可 能 会 很 慢 , 会 导致 系统 短暂 地 被 挂 住 。 如 果 同 时 
有 大 量 的 死 锁 出 现 ， 会 导致 系统 变 得 十 分 缓慢 ， 甚 至 出 现 门 锁 死 锁 ， 导 致 系统 长 时 间 被 挂 住 。 解 
决 办 法 是 设置 10027 事件 。 

10027 事件 从 Oracle 9.2.0.3 和 Oracle 10g 开始 就 已 经 支持 了 。 而 对 Oracle 9.2.0.2 和 Oracle 8.1.7.4, 
可 以 通过 Patch 2235386 来 支持 。10028 事件 的 Level 定义 如 下 。 

a 0x00: 保持 原来 的 状态 ， 转 储 进程 状态 。 

a 0x01: 关闭 进程 状态 转 储 。 

O 0x02; 完成 进程 状态 转 储 后 再 转 储 系 统 状 态 。 
a 0x03; 只 转 储 系统 状态 。 

10027 事件 既 可 以 关闭 进程 状态 转 储 ， 使 死 锁 检查 变 得 更 为 快捷 ， 以 避免 系统 被 挂 住 ， 又 可 
以 在 需要 对 死 锁 进行 更 为 详细 的 分 析 时 加 强 转 储 的 级 别 。 
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E" 3 优化 小 技巧 ) PL/SQL 优化 工具 profiler 


在 Oracle 8i 中 ，PL/SQL 的 效率 得 到 了 较 大 的 提高 。 不 过 PL/SQL 的 性 能 提高 在 不 同 的 硬件 
环境 下 是 不 同 的 , 因此 需要 在 实际 运行 环境 中 对 PL/SQL 的 性 能 进行 分 析 。DBMS_PROFILER £X 
件 包 可 以 帮助 用 户 测 试 PL/SQL 的 性 能 。 

DBMS PROFILER 软件 包 是 Oracle 8i 和 Oracle 9i 的 标准 配置 软件 包 。 在 SORACLE HOME/ 
rdbms/admin 目录 下 可 以 找到 profload.sql 和 proftab.sql 两 个 脚本 。 

首先 在 系统 用 户 下 安装 profload.sql 脚本 ,然后 在 要 测试 PL/SQL 的 用 户 下 安装 proftab.sql 脚本 。 

安装 好 脚本 后 ,就 可 以 使 用 profiler 工具 进行 PL/SQL 的 性 能 测试 了 。 首 先 执 行 如 下 PL/SQL 











代码 : 
declare 
err number; 
begin 
err:-DBMS PROFILER.START PROFILER (to char(sysdate, 'dd-Mon-YYYY hh:mi:ss')); 
-- 此 处 执行 要 测试 的 PL/soL 存储 过 程 或 者 程序 
err:-DBMS PROFILER.STOP PROFILER ; 
end; 
/ 


执行 完毕 后 ， 通 过 下 面 的 查询 找 出 刚才 执行 的 runid; 
column RUN_COMMENT format a40 truncate; 
SELECT runid, run date, RUN COMMENT FROM plsql profiler runs ORDER BY runid; 


然后 ， 用 下 列 查询 查 出 运行 结果 : 
column unit name format a15 truncate; 
column occured format 999999 ; 
column line# format 99999 ; 
column tot time format 999.999999 ; 
SELECT p.unit name, p.occured, p.tot time, p.line# line, 
substr(s.text, 1,75) text 
FROM 
(SELECT u.unit name, d.TOTAL OCCUR occured, 
(d.TOTAL TIME/1000000000) tot time, d.line# 
FROM plsql profiler units u, plsql profiler data d 
WHERE d.RUNID-u.runid and d.UNIT NUMBER - u.unit number 
AND d.TOTAL OCCUR >0 
AND u.runid- &RUN ID) p, 
user source s 
WHERE p.unit name = s.name(+) and p.line# = s.line (+) 
ORDER BY p.unit name, p.line#; 


下 面 是 一 个 输出 的 例子 : 


UNIT_NAME OCCURED TOT TIME LINE TEXT 


NUMBER TEST + .000006 13 dummy:-'end of PLSQL'; 


注意 分 析 TOT_TIME 列 ， 甚 中 包含 的 是 该 语句 执行 的 时 间 。 通 过 分 析 执行 时 间 ， 可 以 制订 详 
细 的 优化 计划 。 

profiler 是 一 个 十 分 重要 的 工具 ， 建 议 大 家 一 定 要 掌握 ， 因 为 这 个 工具 可 以 提供 十 分 精细 的 
分 析 , 对 于 在 优化 工作 中 进行 测试 和 验证 帮助 很 大 。 老 白 在 后 面 的 优化 工作 中 也 会 用 到 这 个 工具 。 


4 
C 


` e e 
ç bd | Y 
Ñ 


58228. ODS 系统 和 RAC 


江苏 的 客户 在 准备 上 线 的 ODS 系统 中 准备 使 用 RAC。 客 户 以 前 在 计 费 账 务 系统 中 使 用 过 
OPS 系统 ， 由 于 应 用 软件 没有 针对 OPS 进行 优化 ， 所 以 OPS 的 使 用 经 历 并 不 愉快 ， 一 直 受 全 局 
缓存 争 用 问题 的 困扰 。 客 户 在 两 个 不 同 的 实例 上 分 别 跑 计 费 和 账 务 两 个 应 用 , 但 是 两 个 实例 需要 
同时 更 新 一 些 热 表 ， 因 此 这 些 热 表 出 现 了 十 分 严重 的 global buffer busy cr 等待， 严重 的 时 候 两 个 
系统 会 变 得 十 分 慢 。 在 每 个 月 的 业务 高 峰 期 ， 由 于 全 局 Cache 的 争 用 ,经 常 导致 系统 响应 时 间 成 
倍 地 增长 。 在 经 过 了 痛苦 的 经 历 后 ， 无 奈 之 下 只 能 拆 分 OPS 系统 ， 并 通过 物化 视图 实现 两 套 系 
统 的 数据 共享 。 因 此 客户 对 于 再 次 使 用 集群 技术 ， 有 点 “一 朝 被 蛇 咬 ， 十 年 怕 井 绳 ”的 感觉 。 

随 着 ODS 系统 大 集中 需求 的 提出 ,今后 单 实例 环境 肯定 无 法 满足 全 省 的 业务 需要 ， 使 用 集 
群 方案 势 在 必 行 。 如 何 建设 一 个 可 持续 扩展 的 应 用 平台 ， 是 下 一 步 ODS 系统 发 展 的 重点 。 为 了 
防止 计 费 账 务 系统 的 经 历 再 次 重演 , 这 回 客 户 和 开发 商 在 技术 方面 做 了 充分 的 准备 。 特 别 是 在 数 
据 字 上 典 的 设计 方面 ,充分 考虑 了 今后 系统 扩展 的 需要 。 而 本 次 技术 交流 的 主要 目的 ,就 是 探讨 在 
新 版 本 的 ODS 系统 中 使 用 RAC 的 可 行 性 以 及 针对 RAC 和 应 用 软件 应 该 做 的 优化 工作 。 

RAC 环境 中 的 优化 是 RAC 系统 成 功 的 关键 。 在 国外 ,RAC 应 用 十 分 成 熟 , 在 系统 设计 的 初 
期 ,大 多 数 系统 就 已 经 充分 考虑 了 RAC 对 性 能 的 影响 ， 因 此 在 软件 架构 设计 时 就 已 经 充分 予以 
考虑 。 刚 上 线 的 时 候 ， 可 能 只 是 一 台 很 小 的 Windows 或 者 Linux 服务 器 ， 随 着 业务 增长 ， 通 过 不 
断 加 入 新 的 RAC 市 点 来 实现 系统 的 扩展 。 因 此 在 国外 ， 超 过 10 个 节点 的 RAC 应 用 比比 丝 是 ， 
甚至 我 还 见 到 过 超过 20 个 节点 的 Linux RAC 集群 。 而 事实 上 ， 国 内 RAC 应 用 得 并 不 很 成 功 ， 
由 于 应 用 软件 未 针对 RAC 进行 相关 的 设计 和 优化 , 最 终 导 致 RAC 系统 出 现 严重 性 能 问题 的 情况 
随处 可 见 。 国 内 的 用 户 一 般 来 说 更 喜欢 淘汰 日 设备、 采购 更 为 强劲 的 新 设备 来 实现 容量 的 扩充 ， 
这 是 因为 软件 开发 商 并 没有 针对 RAC 进行 特殊 的 设计 , 在 编程 的 时 候 也 没有 充分 考虑 RAC 应 用 
环境 的 特点 ， 使 用 RAC Ja, 1+1<1 的 事情 时 有 发 生 ， 因 此 RAC 在 国内 大 多 数 客户 那 边 发 挥 的 主 
要 作用 并 不 是 负载 均衡 和 可 扩展 性 ， 而 是 类 似 于 HA 的 高 可 用 性 。 

为 了 使 ODS 系统 能 够 具有 高 可 扩展 性 , 客户 和 应 用 开发 厂商 决定 在 系统 的 底层 根据 RAC Xf 
噶 进 行 一 系列 有 针对 性 的 设计 和 优化 ， 因 此 ,我 针对 数据 库 、 应 用 软件 等 方面 提出 了 一 系列 的 优 
化 要 点 。 

除了 在 应 用 设计 方面 做 一 定 的 设计 ， 尽 量 避 免 两 个 节点 同时 修改 同一 个 数据 外 ， 对 于 RAC 
系统 , 数据 库 方面 也 有 很 多 需要 优化 的 方法 。 首先 , 针对 数据 库 层面 , 在 RAC 环境 下 , DB Cache 
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的 命中 率 对 系统 的 性 能 影响 远大 于 单 实例 环境 ， 因此 有 效 提高 DB Cache 的 命中 率 , 在 CPU 和 内 
存 资 源 充 足 的 情况 下 合理 设置 DB Cache 启用 多 缓冲 池 等 ， 都 是 提高 DB Cache 命中 率 的 有 效 方 
法 。 客 户 以 前 的 系统 使 用 的 是 Oracle 81 的 OPS， 这 方面 的 问题 更 为 严重 ， 而 由 于 计 费 账 务 系统 
经 常 要 对 大 表 做 扫描 操作 ， 所 以 当时 DB Cache 的 命中 率 经 常会 低 于 90%， 因 此 全 局 Cache HEIL 
问题 也 就 不 足 为 奇 了 。 

另外， 尽量 减少 buffer busy waits, buffer busy waits 会 严重 影响 数据 访问 的 性 能 ， 这 在 RAC 
环境 下 会 更 为 严重 。 对 于 热 块 冲突 较为 严重 的 系统 ， 在 升级 为 RAC 之 前 尽 可 能 进行 针对 性 的 优 
化 十 分 重要 。 在 一 般 情 况 下 ， 表 分 区 是 有 效 减少 热 块 冲 突 的 很 有 效 的 方法 。 对 于 像 电 信 这 样 的 以 
本 地 网 为 运营 核心 的 系统 ,很 少 有 跨越 本 地 网 访问 的 情况 ,系统 中 大 多 数 的 数据 访问 以 本 地 网 为 
维度 ， 因 此 按照 本 地 网 进行 数据 分 区 是 行 之 有 效 的 。 在 RAC 部 署 的 时 候 ， 一 般 来 说 不 建议 采用 
完全 的 负载 均衡 模式 ， 而 是 通过 本 地 网 来 进行 负载 分 配 。 全 省 13 个 本 地 网 ， 可 以 按照 一 定 规则 
分 布 在 RAC 的 不 同 实例 上 ， 这 样 的 负载 分 布 配合 按照 本 地 网 的 表 分 区 ， 可 以 最 大 限度 地 减少 全 
局 的 热 块 冲突 。 解 决 热 块 冲突 的 方法 有 很 多 ， 对 于 表 上 面 的 热 块 冲突 ， 可 以 通过 表 分 区 来 减少 热 
块 冲突 ， 也 可 以 将 热 表 存放 在 块 大 小 较 小 的 表 空 间 上 ,以 减少 热 块 冲突 的 机 会 。 对 于 不 是 很 大 的 
表 ， 可 以 通过 使 用 hash 簇 表 的 方式 来 替代 传统 的 表 (传统 的 表 又 称 为 堆 表 ，Heap Table), hash 
ERIRE EE hash 方式 存放 ， 可 以 将 表 打 散 ， 从 而 减少 热 块 冲 突 。 如 果 热 块 冲 突 是 针对 索 
引 的 ， 那 么 通过 分 区 表 的 本 地 索引 、 反 转 键 索 引 ， 或 者 将 索引 存放 在 较 小 块 大 小 的 表 空 间 中 等 手 
段 ， 可 以 减少 索引 上 的 热 块 冲突 。 

锁 等 待 在 单机 环境 下 也 许 很 正常 ， 但 是 在 RAC 环境 下 ， 严 重 的 锁 等 待 可 能 会 导致 严重 的 性 
能 问题 ， 因 此 尽量 减少 锁 的 使 用 ， 尽 量 减少 不 必要 的 索引 。 尽 量 减少 不 必要 的 SQL 分 析 ， 通 过 
各 种 手段 提高 library cache 和 row cache 的 命中 率 ， 也 可 以 减少 锁 等 待 。 

现在 的 应 用 大 量 使 用 序列 号 (sequence) ,在 RAC 环境 下 ， 需 要 合理 使 用 序列 号 ， 加 大 序列 号 的 
缓冲 ， 尽 量 使 用 NO ORDER 方式 来 有 效 减 少 序列 号 带 来 的 争 用 。RAC 环境 下 普通 的 序列 号 缓冲 是 不 
能 满足 要 求 的 ， 将 缓冲 设置 为 几 百 兆 其 至 几 千 兆 可 以 大 幅度 减少 由 于 序列 号 争 用 引起 的 性 能 问题 。 
如 果 主 键 是 通过 序列 号 产生 的 ， 增 加 序列 号 缓冲 的 大 小 ， 还 有 助 于 减少 主键 索引 引起 的 热 块 冲突 。 

如 果 某 个 和 顺序 无 关 的 主键 是 由 序列 号 形成 的 , 建议 在 主键 中 拼 入 实例 号 以 防止 索引 中 热 块 
的 产生 。 这 需要 对 应 用 进行 小 幅 修改 ,在 生成 主键 时 ， 需 要 获取 实例 号 ， 并 且 将 实例 号 和 从 序列 
号 产生 的 序列 合并 在 一 起 , 形成 主键 , 这 样 的 主键 会 让 不 同 实例 产生 的 记录 在 索引 里 最 大 限度 地 
打 散 ， 最 大 限度 减少 由 于 索引 带 来 的 热 块 冲突 。 同 时 ,索引 应 尽量 采用 本 地 分 区 索引 ， 减 少 实例 
间 的 索引 块 争 用 。 为 了 实现 上 述 目标 ， 使 用 GUID 替代 序列 号 也 是 一 种 方法 。 

对 于 存在 大 量 并 发 插入 操作 的 表 , 尽量 使 用 ASSM (自动 段 空 间 管 理 )。 如 果 没 有 使 用 ASSM, 
那么 应 该 使 用 多 个 Freelist Groups, JF HE 24387] freelists 参数 。 

只 读 表 空 间 (Read Only Tablespace) 对 于 绝 大 多 数 用 户 来 说 都 只 限于 理论 的 学 习 ， 很 少 被 用 
于 实际 生产 系统 。 在 RAC 环境 中 ， 只 读 表 空 间 的 使 用 可 以 大 大 提高 RAC 系统 的 性 能 。 对 于 只 读 
数据 或 者 周期 性 修改 的 数据 ， 可 以 考虑 放 入 只 读 表 空间 中 以 减少 global cache cr request 的 等 待 。 
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我 曾经 处 理 过 一 个 案例 ，Global Cache 存在 较为 严重 的 竞争 ， 后 来 我 采取 了 一 系列 优化 后 将 问题 
解决 了 , 其 中 就 将 最 常用 的 一 些 参 照 表 存放 的 一 个 表 空 间 设置 为 只 读 ， 只 有 需要 修改 这 些 参照 表 
时 才 临 时 设置 成 读 写 。 

一 般 情况 下 ， 如 果 我 们 对 RAC 系统 从 应 用 体系 、 数 据 与 应 用 的 分 布 、 数 据 库 相 关 参 数 等 7 
面 进行 了 相关 优化 ，2 节点 RAC 达到 1.5 — 1.8 倍 单机 处 理 能 力 还 是 难 实现 的 。 

就 这 几 个 问题 ,我 和 客户 以 及 开发 厂商 的 技术 人 员 进 行 了 一 上 午 的 讨论 。 讨 论 的 问题 相当 深 
入 ， 他 们 提出 的 很 多 问题 ， 我 都 必须 认真 思考 一 下 ， 才 能 给 出 合理 的 解释 。 午 饭 时 间 到 了 ， 大 家 
还 是 意犹未尽 ， 由 于 下 午 他 们 要 向 领导 汇报 ， 所 以 我 们 只 好 结束 了 讨论 。 最 后 ， 他 们 希望 我 推荐 
一 些 资料 给 他 们 ， 我 给 他 们 推荐 了 下 面 几 个 Metalink 的 文档 : 

O Note:226561.1 91RAC Tuning Best Practices 
Q Note:226569.1 91RAC Most Common Performance Problem Areas 
Q Note:226573.1 91RAC Workload Characterization 

我 用 U 盘 将 这 几 个 文档 复制 给 他 们 了 。 中 午 和 他 们 一 起 在 食堂 吃 了 顿 工作 餐 ， 吃 饭 时 他 们 
对 我 正在 沈阳 做 的 优化 项 目 十 分 感 兴 趣 ， 也 问 了 很 多 相关 的 问题 。 听 了 我 的 介绍 ,大 家 都 觉得 沈 
阳 的 事情 简直 就 是 一 件 不 可 能 完成 的 任务 。 


PSREN) 以 开放 的 心态 做 服务 


今天 江苏 的 客户 向 老 白 要 一 些 资料 ， 老 白 用 U 盘 拷 给 了 客户 。 在 一 些 朋 友 看 来 ， 老 白 拷 给 
客户 的 资料 都 是 很 重要 的 武林 秘笈 ， 不 应 该 这 么 随便 交 给 客户 。DBA 这 个 圈子 比较 保守 ， 一 般 
不 愿意 把 自己 的 独门 绝技 传人 。 而 老 白 做 服务 这 么 多 年 来 , 一 直 用 一 种 开放 的 心态 ,对 客户 的 要 
求 有 求 必 应 。 记 得 有 一 次 给 客户 做 一 个 巡 检 ， 结 束 后 老 白 把 文档 找 在 U 盘 上 交 给 客户 ， 客 户 犹 
隐 了 半天 ， 问 道 :“ 你 的 那些 脚本 方便 不 方便 留 给 我 *”” 老 白 笑 笑 说 ;“ 在 U 盘 里 已 经 有 这 些 脚 
本 了 ， 我 们 做 完 巡 检 ， 会 把 巡 检 过 程 全 部 记录 下 来 ， 并 且 会 把 使 用 过 的 脚本 全 部 提交 给 客户 。 

老 白 服务 的 客户 很 多 ， 有 些 客户 都 已 经 和 老 白 打 了 五 六 年 交道 了 ,关系 一 直 比 较 融 洽 ， 主 要 
的 原因 就 是 老 白 从 来 不 保守 ， 客 户 需要 什么 资料 就 会 毫 无 保留 地 提供 。 客 户 咨 询 什么 问题 ， 老 白 
一 般 来 说 除了 当面 口头 回答 外 ， 事 后 还 会 以 很 详细 的 报告 提交 。 

用 一 个 形象 的 说 法 就 是 ， 如 果 目 前 客户 处 于 4 点 ， 我 们 做 服务 的 处 于 8B 点，B 点 高 于 4 点 ， 
而 我 们 做 服务 的 一 个 很 重要 的 任务 是 使 客户 的 技术 从 4 点 向 B 点 迈进 ， 同 时 我 们 自己 也 在 从 B 
点 向 C 点 前 进 。 当 客户 达到 B 点 时 , 我 们 已 经 达到 了 C 点, 这 时 我 们 就 可 以 帮助 客户 从 B 点 向 C 
点 迈进 , 而 我 们 也 向 更 高 的 目标 前 进 。 如 果 是 这 样 一 种 情况 ,我 们 就 不 会 害怕 客户 的 提高 危及 我 
们 自己 的 饭碗 。 对 于 客户 而 言 ， 我 们 永远 是 有 价值 的 ， 可 以 帮助 他 们 向 更 高 的 目标 迈进 。 

如 果 做 服务 的 没有 开放 的 心态 ,把 自己 的 那些 招数 保护 得 死 死 的 ， 那 早晚 是 会 做 死 的 。 保 守 
就 很 难 进步 ， 时间 长 了 ， 你 的 价值 就 会 越 来 越 低 。 所 以 我 觉得 以 开放 的 心态 来 做 服务 ， 让 客户 在 
你 的 帮助 下 提高 ， 促 使 自己 也 不 断 进 步 才 是 根本 之 道 。 
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置信 优化 小 技 瑟 ) 全 局 热 块 冲突 





全 局 热 块 冲突 是 RAC 平台 经 常 出 现 的 一 种 等 待 事件 ， 这 种 等 待 如 果 比 较 严 重 的话 ， 会 对 系 


统 的 性 能 产生 十 分 重大 的 影响 ， 甚 至 导致 数据 库 被 短 时 挂 住 。 
全 局 热 块 冲突 和 普通 的 热 块 冲突 类 似 , 普通 的 热 块 冲突 是 在 一 个 单 节 点 上 多 个 会 话 访问 相同 
的 数据 块 导致 的 等 待 事件 。 如果 大 量 会 话 访问 某 个 或 某 些 特定 的 数据 块 , 那么 这 些 数据 块 被 称 为 





热 块 。 相 比 单 实例 环境 , 全 局 热 块 冲突 的 危害 更 大 ， 因 
重 的 全 局 热 块 冲突 会 导致 系统 性 能 急剧 下 降 。 











为 全 局 的 热 块 需要 在 实例 间 进 行 传递 。 严 





最 典型 的 案例 就 是 ， 如 果 某 个 应 用 要 对 某 张 表 进 行 大 批量 的 数据 插入 , 而 且 插 入 的 进程 都 跑 
在 一 个 节点 上 ， 那 么 这 个 系统 可 能 会 出 现 一 些 buffer busy waits 等 待 事件 ， 不 过 不 会 产生 很 严重 
的 性 能 问题 。 如 果 这 个 应 用 负载 均衡 方式 分 布 在 不 同 的 节点 上 上， 那么 从 STATSPACK/AWR 报告 


中 ， 我 们 可 能 看 到 下 面 的 情况 : 


Top 5 Timed Events 


Event Waits 
buffer busy waits 17,149 
gc buffer busy 21,057 
enq: HW - contention 19,571 
CPU time 

gc current block 2-way 207,726 


Avg $Total 
wait Call 


Time (s) (ms) Time Wait Class 
12,743 743 37.3 Concurrenc 
12,328 585 36.1 Cluster 

7,155 366 20.9 Configurat 
1:253 ST 
525 3 1.5 Cluste 


对 于 这 种 情况 ， 需 要 在 应 用 的 底层 进行 设计 。 比 如 有 一 种 很 常用 的 方法 ， 就 是 在 某 张 表 中 设计 一 
个 INSTANCE ID 字段 ,在 插入 数据 时 ， 每 个 实例 插入 的 数据 中 都 带 有 INSTANCE_ID， 然 后 按照 
INSTANCE_ID 对 这 张 表 进行 分 区 ， 两 个 实例 之 间 的 gc buffer busy 争 用 就 会 大 幅度 地 减少 。 下 面 








就 是 通过 这 种 方式 优化 后 的 AWR 报告 。 








C | is 
log file sync 554,591 334 


log file parallel write 536,004 106 0 

gc cr multi block 449,571 85 0 
request 

417,500 73 0 


从 上 面 的 报告 可 以 看 出 ，gc buffer busy 消失 了 。 





SSi) PL/SQL 中 数据 类 型 的 性 能 





92.3 

23.1 Commit 
7.3 System I/O 
5.9 Cluster 
5.1 Other 


在 PL/SQL 编程 中 ， 要 注意 数据 类 型 的 使 用 。PL/SQL 支持 多 种 兼容 的 数据 类 型 ， 选 择 适 合 
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的 数据 类 型 对 于 PL/SQL 的 性 能 有 很 大 的 影响 。 下 面 是 一 个 简单 的 例子 : 


create or replace procedure testplsql is 
anumber number ; 
ainteger integer; 
anumber 10 number(10); 
apls integer pls integer; 
abinary BINARY integer; 
err number; 
begin 
anumber:=0; 
loop 
anumber :=anumber+1; 
ainteger:=ainteger+1; 
anumber_10:=anumber_10+1; 
apls_integer:=apls_integer+1; 
abinary:-abinary-*1; 
exit when anumber>1500 ; 
end loop; 
end; 
/ 


这 个 例子 中 测试 了 number. integer, number(n), pls integer, BINARY integer 这 
儿 种 整数 类 型 的 运行 效率 。 
我 们 使 用 了 DBMS_PROFILER 进行 了 测试 ， 代 码 如 下 : 


declare 

err number; 

begin 

err:-DBMS PROFILER.START PROFILER (to char(sysdate,'dd-Mon-YYYY hh:mi:ss')); 
testplsql; 
err:=DBMS_PROFILER.STOP_PROFILER ; 

end; 

/ 

查询 profiler 表 ， 其 结果 如 下 : 

模块 执行 时 间 行 号 语句 

TESTPLSQL .000350 9 anumber:=0; 

TESTPLSQL  .358233 11 anumber :=anumber+1; 

TESTPLSQL .358399 12 ainteger:=ainteger+1; 

TESTPLSQL .363219 13 anumber_10:=anumber_10+1; 

TESTPLSQL  .133521 14 apls integer:-apls integer-41; 

TESTPLSQL  .498786 15 abinary:-abinary-*1; 

TESTPLSQL .511632 16 exit when anumber>1500 ; 

从 测试 结果 可 以 看 出 ，pls_integer 最 快 ， 其 次 是 number 和 integer 类 型 ， 最 慢 的 是 

BINARY_integer。 产 生 这 种 差异 的 原因 何在 呢 ? pls integer 是 PL/SQL 2.2 版 本 的 标准 整 型 








类 型 ， 只 要 是 整 型 变量 ， 取 值 范 围 在 -2 147 483 647 和 +2 147 483 647 之 间 的 整数 都 可 以 用 
pls integer 来 表示 。pls_integer 是 直接 和 C 语 言 的 类 型 对 应 的 ， 在 执行 过 程 中 没有 类 型 转 
换 的 开销 ， 因 此 最 快 。 
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使 用 和 C 语言 类 型 对 应 的 类 型 来 定义 变量 可 以 大 大 提高 PL/SQL 的 效率 。 


型 和 C 语 言 类 型 的 对 应 关系 。 


C 语言 类 型 
char 
char * 
double 
double * 
float 
float * 
int 

int * 
long int 
long int * 
short 
short * 
void * 


PL/SQL 参数 


o 


ase á 


eovovowo 


UT VARCHAR2 
MBER 
T NUMBER 
MBER 
UT NUMBER 
LS_INTEGER 
UT PLS_INTEGER 
NTEGER 
LS_INTEGER 
NTEGER 
LS_INTEGER 


"m 


"m 





E 
UHUH 











"m 


PL/SQL 返回 值 
VARCHAR2 
VARCHAR2 
NUMBER 
NUMBER 
UMBER 
UMBER 

LS INTEGER 
LS INTEGER 
LS INTEGER 
LS INTEGER 
LS INTEGER 
LS INTEGER 





O'uyuuuuuuz 





下 面 是 PL/SQL 类 


RA FFI.POINTERTYPE 


{À 
\_A 


c. A e. 
» ` ` JÀ 


5B23B À 实时 ODS 


今天 是 本 次 江苏 之 行 的 最 后 一 天 ， 主 要 内 容 是 讨论 ODS 系统 中 的 数据 采集 技术 。ODS 系统 
是 企业 信息 化 建设 中 的 关键 系统 , 是 目前 国内 电信 运营 商 为 了 提高 服务 水 平 、 掌 握 营 销 全 局 的 重 
要 辅助 系统 。ODS 系统 具有 以 下 几 个 特点 : 

a 面向 主题 的 ， 

a 集成 的 ; 

O 易 变 的 ; 

a 明细 的 ， 

O 反映 当前 数据 。 

ODS 是 企业 数据 架构 中 最 为 复杂 的 一 种 形态 ， 既 要 满足 数据 事务 操作 要 求 ， 又 要 满足 数据 
分 析 要 求 , 因此 ODS 系统 的 建设 也 是 一 项 十 分 具有 挑 成 性 的 工作 。 根 据 数 据 刷新 实时 性 的 不 同 ， 
我 们 可 以 把 ODS 系统 划分 为 以 下 几 类 。 

a IX ODS: 数据 延迟 为 1~2 秒 ,实时 或 近似 实时 。 

O I% ODS: 数据 延迟 为 2~4 小 时 。 

a MAE ODS: 数据 延迟 为 12 一 24 小 时 。 

a IVE ODS: 数据 仓库 中 部 分 决策 分 析 数 据 回流 至 ODS 中 。 

数据 延迟 时 间 越 短 , ODS 建设 难度 越 高 , 其 中 I 类 ODS 的 建设 难度 最 高 , 成 本 也 是 最 高 的 。 
但 是 I 类 ODS 的 实时 性 ， 可 以 为 企业 决策 提供 最 为 及 时 的 分 析 数 据 ,因此 I 类 ODS 往往 是 企业 
经 营 者 最 为 需要 的 。 由 于 工 类 ODS 的 实时 性 ， 它 对 技术 的 要 求 与 其 他 类 型 的 ODS 也 有 所 不 同 。 
一 般 来 讲 需 要 用 到 一 些 特殊 的 技术 ,对 于 企业 级 用 户 来 说 , 如何 高 效 地 对 海量 数据 进行 变更 捕捉 、 
变更 传输 是 ODS 系统 中 的 关键 问题 。 对 于 技术 的 高 要 求 导致 实施 难度 相当 大 ， 因 此 在 国内 已 经 
在 运行 的 ODS 系统 中 ，I 类 ODS 几乎 很 难看 到 。 

客户 的 ODS 建设 的 起 点 很 高 , 在 建设 之 初 就 提出 了 ODS 系统 的 数据 采集 以 I 类 和 工 类 为 主 
的 数据 采集 思路 ， 因 此 ODS 系统 建设 的 难度 较 大 ， 对 于 数据 采集 的 要 求 较 高 。ODS 系统 的 数据 
采集 不 仅仅 是 从 业务 系统 中 将 数据 复制 到 ODS 系统 中 ， 要 求 更 多 的 是 捕捉 到 数据 变化 的 情况 ， 
根据 数据 的 变化 来 生成 ODS 所 需要 的 原始 数据 ， 提 交 给 各 种 分 析 应 用 使 用 。 传 统 的 数据 采集 方 
式 都 很 容易 实现 数据 复制 ， 但 是 对 于 数据 变更 的 捕捉 能 力 不 足 。 

由 于 ODS 系统 是 面向 业务 的 , 所 以 随 着 业务 的 发 展 , ODS 系统 数据 采集 的 需求 会 不 断 变 化 。 
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这 种 易 变 的 特性 需要 ODS 的 数据 采集 系统 采用 良好 的 架构 ， 具 有 很 好 的 扩展 性 。 

对 于 Oracle 数据 库 来 说 ，ODS 系统 的 数据 采集 一 般 可 以 使 用 以 下 方式 。 

O 离线 文件 方式 : 将 业务 系统 变化 捕捉 后 形成 文件 形式 , 传输 到 ODS 系统 , 导入 ODS 系统 。 

a ETL 数据 泵 抽取 方式 : 通过 工具 ， 从 生产 系统 抽取 数据 ， 导 入 ODS 系统 。 

O 高 级 复制 : 通过 Oracle 高 级 复制 技术 将 生产 系统 的 数据 复制 到 ODS 系统 。 

O Oracle Streams: 通过 Oracle Streams 捕捉 生产 系统 的 变化 ， 并 将 逻辑 变化 记录 (LCR) f£ 
输 给 ODS 系统 ， 由 接口 程序 处 理 ODS， 并 形成 ODS 系统 的 最 终 数据 。 

离线 文件 的 传输 是 通过 编程 的 方式 将 生产 数据 打包 成 一 定格 式 的 文件 ， 通 过 FTP 等 手段 传 
输 到 ODS 系统 ， 然 后 使 用 SQL*Loader 等 工具 将 数据 导入 ODS 系统 。 这 种 方式 需要 通过 专门 的 
程序 来 对 文件 传输 和 数据 入 库 过 程 进行 监控 ， 确 保 数据 复制 的 正确 性 。 

ETL 数据 泵 抽取 技术 由 于 采用 对 生产 库 系 统 进行 扫描 获取 相应 数据 的 方式 , 所 以 对 生产 系统 

J 影响 较 大 。 这 种 方式 比较 适合 于 抽取 频率 较 低 (比如 每 天 一 次 、 每 月 一 次 等 ) 的 非 实时 数据 的 
抽取 。 

高 级 复制 技术 本 身 不 是 一 种 数据 抽取 技术 而 是 一 种 数据 复制 技术 , 其 主要 任务 是 将 数据 从 生 
产 数据 库 中 复制 到 ODS 数据 库 或 者 接口 数据 库 。ODS 系统 需要 对 这 些 数据 进行 分 析 ， 才 能 捕捉 
到 需要 抽取 的 内 容 。 

Oracle Streams 技术 既 支持 数据 复制 ， 也 支持 变更 捕捉 ， 是 一 种 十 分 适合 ODS 系统 数据 采集 
的 技术 。Streams 可 以 通过 LogMiner 技术 分 析 生 产 系统 的 日 志 ， 将 所 关心 的 变更 信息 采集 出 来 ， 
通过 高 级 队列 传输 到 ODS 系统 。 这 样 ODS 系统 收 到 的 不 仅仅 是 简单 的 表 或 者 视图 ， 而 是 某 个 
ODS 系统 所 关心 的 数据 的 变化 增 量 。 通 过 这 个 变化 增 量 ，ODS 系统 可 以 更 为 灵活 地 生成 决策 支 
持 所 需要 的 数据 ， 而 不 需要 采用 低 效 的 数据 比 对 方法 来 确定 当前 数据 发 生 了 什么 变化 。 

我 们 向 客户 推荐 了 Streams， 不 过 由 于 客户 主要 的 数据 库 都 是 Oracle 9i， 部 分 还 是 Oracle 8i， 
目前 直接 使 用 Streams 技术 还 存在 一 定 的 问题 ， 因 此 决定 上 暂时 使 用 过 渡 性 方案 ， 就 是 使 用 物化 视 
图 日 志 产 生 数 据 库 表 的 变化 矢量 , 然后 通过 应 用 程序 直接 对 物化 视图 日 志 进 行 处 理 , 通过 物化 视 
图 获取 相关 的 变更 信息 ， 处 理 完毕 后 ， 手 工 删除 物化 视图 日 志 中 相关 的 数据 。 

这 种 处 理 有 两 个 要 点 。 一 个 是 标准 的 物化 视图 日 志 只 是 一 个 根据 时 间 惟 的 记录 变更 记录 ,， 比 
如 对 某 条 记录 做 了 2 次 更 新 , 那么 在 日 志 里 存放 的 只 是 变化 的 过 程 , 而 每 次 如 何 变化 是 不 记录 的 ， 
这 和 Streams CDC 是 不 同 的 。 这 样 的 处 理 对 于 高 级 复制 是 足够 的 ， 因 为 复制 只 需要 保证 目标 和 源 
一 致 ， 而 ODS 系统 很 多 情况 下 是 对 某 种 变化 进行 统计 分 析 ， 并 依据 变化 的 实际 内 容 产 生 一 系列 
数据 ,不 是 简单 的 数据 复制 。 因 此 每 个 物化 视图 日 志 都 要 根据 业务 的 特点 来 进行 设计 ， 确 保 分 析 
需要 的 所 有 字段 都 在 日 志 中 存在 。 

第 二 点 是 ， 不 能 通过 标准 的 刷新 过 程 来 刷新 物化 视图 ，ODS 系统 并 不 一 定 需要 存在 一 个 物 
化 视图 ， 应 用 程序 对 物化 视图 日 志 进 行 处 理 后 ,根据 应 用 的 要 求 进行 处 理 ， 比 如 删除 已 经 处 理 完 
的 记录 。 

实际 上 物化 视图 是 通过 物化 视图 日 志 来 实现 物化 视图 的 刷新 的 。 如 果 一 个 物化 视图 需要 快速 
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刷新 ， 那么 就 必须 创建 物化 视图 日 志 。 一 旦 创建 了 物化 视图 日 志 , 除了 会 产生 一 个 物化 视图 日 志 
对 象 外 ， 还 会 创建 一 张 和 物 化 视图 日 志 名 字 相 同 的 表 ， 这 张 表 用 于 记录 主 表 的 变化 信息 。 实 际 上 
物化 视图 日 志 里 的 数据 是 由 一 个 系统 触发 器 生成 的 , 当主 表 的 数据 发 生变 化 时 , 这 会 触发 这 个 触 
发 器 ， 将 变化 的 情况 写 入 物化 视图 日 志 。 物 化 视图 日 志 可 以 被 ODS 系统 使 用 ， 通 过 读 取 物化 视 
图 日 志 ， 了 解 生产 系统 的 数据 变化 ,但 是 物化 视图 日 志 中 能 够 记录 的 信息 比较 少 ， 只 有 主键 、 操 
作 模 式 、 时 间 惟 等 信息 ， 而 ODS 需要 的 数据 变化 的 信息 较 难 获取 。 虽 然 我 们 可 以 在 创建 物化 视 
图 日 志 时 将 某 些 字段 包含 进去 , 但 是 这 样 会 增加 物化 视图 日 志 的 大 小 。 如 果 记 录 的 字段 数量 太 多 ， 
会 影响 生产 系统 的 性 能 。 

不 过 目前 这 种 情况 下 , 只 能 通过 物化 视图 日 志 来 获取 数据 的 变化 量 了 ,这 是 没有 办 法 的 办 法 。 

虽然 对 于 使 用 Streams 存在 一 定 的 疑虑 ， 不 过 Streams 优秀 的 特性 还 是 深 深 打动 了 每 个 人 。 
最 后 李 工 希望 我 们 能 够 给 他 们 做 一 个 Streams 数据 采集 的 测试 。 测 试 的 方法 是 在 模拟 两 个 生产 库 
和 一 个 ODS 库 。 在 两 个 生产 库 上 分 别 通过 Streams 采集 变化 记录 ， 并 通过 高 级 队列 传播 到 ODS 
库 上 。ODS 库 收 到 变化 记录 后 ， 先 将 数据 复制 到 一 张 表 中 ， 并 通过 变化 记录 中 的 数据 修改 一 张 
统计 表 中 的 数据 。 

当天 下 午 ， 在 南京 办 事 处 ， 我 和 小 邓 、 小 张 一 起 进行 了 测试 。 我 们 直接 通过 Oracle 9.2.0.8 
的 库 进行 实验 。Oracle 公司 建议 使 用 Oracle 9.2.0.6 以 上 的 版 本 ， 因 为 手头 只 有 Oracle 9.2.0.8 的 升 
级 包 ， 所 以 我 们 直接 使 用 Oracle 9.2.0.8。 

首先 我 们 模拟 了 一 个 200 万 数据 的 变化 ， 在 生产 库 上 产生 200 万 新 数据 ,测试 ODS 库 上 接 
收 和 处 理 数据 的 情况 。 这 个 实验 到 晚上 11 点 多 才 结 束 ， 测 试 十 分 成 功 。ODS 库 上 的 数据 延 时 在 
一 分 钟 以 内 ， 生 产 库 一 切 正常 ， 并 没有 因为 Streams 受到 严重 的 影响 。 

我 让 小 邓 第 二 天 继续 实验 ,测试 如 果 ODS FER Apply Handler 出 问题 后 ， 生 产 库 是 否 会 受到 
影响 。 如 果 这 个 实验 能 够 通过 ， 我 们 其 至 可 以 建议 客户 跳 过 物化 视图 日 志 ， 直 接 使 用 Streams, 










































































o» 今日 点 评 

Streams 技术 是 一 项 十 分 好 的 技术 , 随 着 Oracle Streams 的 不 断 成 熟 , 今后 完全 可 能 替代 目前 
的 一 些 复制 技术 。 基 于 Streams 的 复制 可 能 会 替代 传统 的 物化 视图 。 

在 Oracle 9.2.0.8 E, Streams 已 经 比较 成 熟 了 ， 虽 然 国内 用 户 使 用 得 还 不 多 ， 在 国外 的 应 用 
案例 比比 缘 是 。 老 白 这 些 年 也 实施 了 不 少 Streams 的 案例 ，Oracle 9i 上 Streams 的 主要 问题 是 它 
使 用 共享 池 作 为 缓冲 区 ， 很 可 能 由 于 Streams 出 现 流 控 ， 积 压 数据 而 影响 共享 池 。 因 此 ， 在 共享 
池 和 争 用 较 严 重 的 系统 中 或 者 系统 负载 比较 高 的 系统 中 ， 要 慎重 使 用 。 对 于 10.2 版 本 的 数据 库 ， 
Streams 技术 更 为 成 熟 ，Streams 池 完 全 独立 了 出 来 ， 因 此 Streams 导致 生产 库 故 障 的 机 会 大 大 下 
降 。 只 要 打 好 相关 补丁 ， 一般 来 说 ，Streams 的 运行 还 是 相对 平稳 的 。 相 比 DSG 等 第 三 方 复制 产 
品 来 说 ，Streams 也 一 点 都 不 进 色 ， 在 经 过 充分 优化 的 情况 下 ， 其 性 能 也 是 十 分 出 色 的 ， 在 一 个 
每 天 产生 200GB —300GB 重 做 日 志 的 系统 中 ， 通 过 流 复制 复制 绝 大 多 数 表 ， 如 果 优 化 得 当 ， 其 
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延 时 可 以 控制 在 10 分 钟 以 内 。 

不 过 对 于 广域网 环境 下 的 数据 复制 来 说 ，Streams 可 能 由 于 广域网 的 网 络 性 能 不 稳定 而 导致 
一 些 性 能 问题 。Streams 不 一 定 需要 很 高 的 带宽 ， 但 是 对 网 络 带 宽 的 稳定 性 要 求 较 高 。 因 此 ， 在 
广域网 中 使 用 Streams， 尽 可 能 选择 传输 较为 稳定 的 光纤 专线 或 者 数字 专线 。 

使 用 Streams 的 朋友 一 定 要 阅读 一 下 Metalink 的 文档 437838.1 (Recommended Patch for 
Streams), 290605.1 (Oracle Streams STRMMON Monitoring Utility), 752871.1 (Streams Complete 
Reference FAQ), 746247.1 (Troubleshoot and Resolve Streams Capture when it is Paused for flow 
control), 418755.1 (10gR2 Streams Recommended Configuration) , 


& 人 优 化 小 技巧) ODS 系统 中 Oracle 数据 库 设计 管理 要 点 


现在 很 多 行业 都 在 建设 ODS 系统 ，ODS 系统 的 主要 特点 是 海量 存储 、 数 据 变化 快 、 分 析 统 
计 型 的 查询 比较 多 。 因 此 ， 对 于 ODS 系统 的 配置 也 有 一 些 特殊 的 地 方 ， 本 节 的 目的 是 探讨 几 个 
对 于 ODS 系统 今后 发 展 十 分 重要 的 方面 ， 这 些 方面 应 该 在 ODS 设计 时 充分 考虑 。 

由 于 ODS 系统 是 易 变 的 , 所 以 ODS 的 数据 采集 框架 一 定 要 有 比较 好 的 设计 , 元 数据 的 管理 
也 要 比较 规范 。ODS 系统 的 数据 来 源 十 分 复杂 ， 可 能 来 自 于 不 同 的 系统 、 不 同 的 数据 库 ， 部 分 
数据 还 可 能 来 自 于 平面 文件 。 因 此 ， 选 择 ODS 数据 采集 产品 和 数据 采集 框架 一 定 要 十 分 慎重 。 
Oracle 的 Streams 是 一 个 不 错 的 数据 变化 量 采 集 框架 ， 很 多 DBA 都 使 用 过 Streams ， 不 过 主要 用 
途 是 数据 复制 。 实 际 上 ，Streams 提供 了 十 分 优秀 的 API， 其 基本 原理 是 通过 重 做 日 志 获 得 数据 
变化 的 记录 ， 然 后 通过 暂 存 转发 机 制 ， 通 过 AQ 传输 到 目的 地 ， 然 后 通过 Apply Handler 将 变化 
量 取出 , 进行 处 理 后 提交 到 目的 数据 库 中 。 在 实际 使 用 时 , 我 们 可 以 使 用 这 个 框架 通过 API 来 处 
理 各 种 情况 。 如 果 我 们 要 从 一 个 非 Oracle 数据 库 中 获取 变化 量 ， 然 后 提交 到 Oracle 数据 库 中 ， 
比如 源 数据 库 是 SQL Server, 那么 可 以 在 SQL Server 服务 器 上 获取 到 数据 库 的 变化 量 , 然后 通过 
Streams 的 API 将 这 些 变化 量 放 入 AQ 中 ， 传 输 到 目的 数据 库 上 ， 用 目的 数据 库 的 Apply Handler 
取出 变化 量 ， 进 行 处 理 后 ， 写 入 目标 数据 库 中 。 实 际 上 ，ODS 数据 库 需 要 的 很 多 数据 不 是 直接 
从 原始 数据 库 中 复制 数据 , 而 是 要 通过 原始 数据 库 中 的 数据 变化 量 来 更 新 ODS 库 中 的 某 些 数据 。 
这 种 情况 下 ,捕捉 变化 量 是 十 分 关键 的 。 通 过 Streams 获取 变化 量 , 经 过 处 理 后 再 修改 ODS 数据 
的 方式 十 分 有 效 。 

ODS 数据 库 中 还 有 大 量 的 数据 是 直接 从 生产 库 中 复制 过 来 的 。 复 制 这 些 数据 的 方法 有 很 多 ， 
最 常用 的 是 物化 视图 。 物 化 视图 是 一 种 十 分 高 效 和 易于 管理 的 数据 复制 技术 ,目前 已 被 广泛 应 用 。 
它 在 ODS 系统 中 也 是 最 常用 的 数据 复制 技术 , 任何 一 套 ODS 系统 中 都 少不了 它 。ODS 系统 采用 
的 技术 适合 用 就 好 ， 最 鼠 讳 的 是 片面 强调 框架 和 新 技术 ， 因 为 ODS 系统 是 在 动态 中 维护 和 管理 
的 ， 所 采用 技术 的 维护 成 本 是 要 充分 考虑 。 

在 设计 ODS 数据 库 时 , 一般 建议 使 用 ASSM 技术 。 不 过 在 ODS 数据 库 中 , 也 应 该 设计 部 分 
MSSM 的 表 空 间 ,因为 ASSM 表 空 间 存 在 大 量 的 bug ,可 能 导致 ORA-600 [kcbgtcr xx] 和 ORA-600 
[kcbnew_xx] 错 误 。 对 于 那些 经 常 要 截断 (truncate) 后 重新 载 和 数据 的 表 ,一 旦 出 现 上 述 的 ORA-600 
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错误 ， 那 么 可 以 将 这 些 表 转移 到 MSSM 的 表 空 间 上 。 

在 表 空间 的 设计 上 , 一般 建议 使 用 统一 大 小 , 这 样 可 以 避免 今后 出 现 表 空间 碎片 的 问题 。 在 
规划 之 初 往往 感觉 ODS 系统 容量 十 分 充足 ， 不 过 运行 一 两 年 后 ， 就 会 发 现 扩容 赶不上 数据 的 增 
长 ,这 是 ODS 系统 易 变 的 特性 决定 的 。 随 着 ODS 应 用 的 深入 ， 业 务 需求 不 断 地 增加 ， 容 量 不 足 
的 问题 很 容易 出 现 ， 如 果 再 有 大 量 的 空间 被 浪费 在 表 空间 碎片 中 ， 那 么 就 更 不 值 了 。 使 用 统一 扩 
展 大 小 , 会 对 应 用 部 署 设 计 带 来 一 定 的 挑战 。 需 要 设计 几 种 统一 大 小 的 表 空间 ,每 种 表 空 间 有 有 儿 
^r. 各 有 多 大 容量 ?这 些 都 要 预先 设计 好 ,并 且 要 在 数据 库 维 护 工作 开展 时 不 断 调整 。 比 如 数据 
里 是 否 存在 LOB 字段 , 这 些 LOB 字段 都 是 多 大 的 , 是 否 大 多 数 不 能 in-line 存储 ? 这 些 对 于 数据 
字典 的 设计 有 很 大 的 影响 。 如 果 LOB 字段 都 很 大 ， 甚 至 有 几 千 个 字 节 ， 那 么 这 种 情况 下 将 其 和 
表 放 在 相同 的 表 空间 肯定 是 不 合适 的 。LOB 字段 需要 存放 在 比 统一 大 小 更 大 的 表 空 间 里 ， 甚 至 
需要 存放 在 块 更 大 的 表 空间 里 。 

在 ODS 系统 中 使 用 不 同 的 数据 块 大 小 是 很 正常 的 事情 ， 这 在 OLTP 系统 中 却 很 少 使 用 。 实 
际 上 使 用 不 同 大 小 的 数据 块 无 论 对 于 OLTP 系统 还 是 对 于 OLAP 系统 ,都 是 十 分 好 的 ,不 过 由 于 
目前 国内 软件 开发 往往 注重 功能 性 的 实现 ， 而 较为 忽视 性 能 和 维护 方面 的 问题 ， 所 以 在 应 用 中 很 
少 使 用 多 种 数据 块 大 小 。 在 ODS 系统 中 ,可 能 存在 某 些 索 引 需 要 存放 在 较 小 块 大 小 的 表 空 间 里 ， 
而 某 些 经 常 做 全 表 扫 描 的 表 适 合 存放 在 较 大 块 大 小 的 表 空 间 里 。 这 些 都 需要 ODS 的 设计 者 充分 
考虑 ， 否 则 等 到 出 现 性 能 问题 时 再 来 调整 ， 代 价 就 十 分 高 了 ， 因 为 ODS 系统 除了 易 变 之 外 ， 一 
个 特点 就 是 海量 存储 。 


E initials) ODS 系统 中 的 开发 要 点 


ODS 系统 的 数据 是 海量 存储 ， 数 据 抽取 、 导 入 、 分 析 都 会 面 对 大 量 的 数据 。 如 何 处 理 海量 
数据 是 一 个 恒久 的 话题 。 提 高 海量 数据 处 理 速度 是 DBA 经 常 面 对 的 问题 。 其 实 开 发 人 员 也 需要 
补充 一 些 海量 数据 处 理 的 常识 。 下 述 要 点 就 是 写 给 开发 人 员 的 。 

a 尽 可 能 使 用 INSERT /*+ APPEND */。 在 ODS 系统 中 存在 大 量 的 INSERT…SELECT… 操 

作 ， 我 看 到 很 多 ODS 应 用 在 这 种 情况 下 都 没有 使 用 /*+ APPEND */ 提 示 。 使 用 APPEND 
提示 可 以 大 大 提高 批量 插入 的 性 能 。 
O 批量 提交 : 对 于 大 批量 数据 的 插入 ， 应 该 使 用 批量 提交 。 对 于 每 次 应 提交 多 少 条 记录 ， 
没有 一 个 明确 的 数字 ， 它 和 表 的 行 长 度 、 数 据 库 配 置 、 重 做 日 志 性 能 等 都 有 关系 ， 不 过 
一 般 来 说 批量 应 该 在 几 百 条 以 上 。 具 体 多 大 的 批量 好 ， 通 过 实际 试验 测试 才能 有 比较 准 
确 的 结果 。 比 如 某 个 插入 ， 可 能 3 000 条 记录 时 性 能 最 好 ， 超 过 3 000 条 ， 性 能 提升 就 不 
大 ， 超 过 5 000 条 性 能 反而 下 降 。 

O bulk 操作 : 数组 操作 从 Oracle 7 开始 就 在 OCI 里 支持 了 。 无 论 是 DML 还 是 SELECT 在 大 
批量 数据 操作 时 ， 使 用 bulk 操作 都 可 以 大 幅度 提高 性 能 。 如 果 使 用 的 是 C 语言 ，Pro*C 
和 OCI 都 支持 bulk 操作 ， 如 果 使 用 的 是 PL/SQL， 也 可 以 通过 FORALL 操作 来 实现 bulk 
操作 。 
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O 充分 考虑 undo 的 承受 能 力 : ODS 系统 中 经 常 要 生成 一 些 临时 表 ， 或 者 往 临 时 表 里 写 入 数 
据 。 经 常 的 操作 是 INSERT INTO…SELECT， 这 种 操作 往往 会 消耗 大 量 的 undo， 甚 至 导致 
undo 表 空 间 不 足 。 对 于 超大 量 数据 的 操作 ， 最 好 能 够 分 段 进行 以 避免 undo 问题 。 


P 


RENGA) 集合 类 型 的 效率 


集合 类 型 的 性 能 一 定好 吗 ? 下面 的 例子 用 于 分 析 集合 类 型 的 效率 。 


CREATE OR REPLACE TYPE big emp ename t AS TABLE OF varchar2(10); 


/ 


CREATE OR REPLACE TYPE big emp ename v AS VARRAY(200002) of varchar2(10); 


/ 


CREATE OR REPLACE PROCEDURE coll test IS 
TYPE big emp ename i IS TABLE OF varchar2(10) INDEX BY BINARY INTEGER; 
big emp cache t big emp ename t; 
big emp cache v big emp ename v; 
big emp cache i big emp ename i; 














CURSOR big emp curs IS SELECT rownum, ename FROM big emp; 
cnt number; 

ename varchar2(10); 

p pls integer; 





BEGIN 
big emp cache t:-big emp ename t(' '); --to initilaize 
big emp cache v:-big emp ename v(' '); --to initilaize 





FOR be r IN big emp curs LOOP 
big emp cache t(be r.rownum):-be r.ename; 
big emp cache t.EXTEND; 
big emp cache v(be r.rownum):-be r.ename; 
big emp cache v.EXTEND; 


EN. 


SEI 


SEI 








big. emp cache i(be r.rownum):-be r.ename; 





LECT 





LECT 
FROM 


WHERE 


SE 


W. 


LECT 
FROM 
HERE 


ename:-'DUMMY'; 
D LOOP; 


COUNT(*) INTO cnt FROM big emp WHERE ename-'SCOTT'; 


COUNT(*) cache t INTO cnt 
TABLE(CAST( big emp cache t AS big emp ename t)) be c 
be c.column value-'SCOTT'; 





COUNT(*) cache v INTO cnt 
TABLE(CAST( big emp cache v AS big emp ename v)) be c 
be c.column value-'SCOTT'; 





ename:- big emp cache t(100000); 
FOR i in 1..1000 LOOP 
p:=100000+i; 

ename:- big_emp_cache_t(p); 
ename:= big_emp_cache_v(p); 
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ename:- big emp cache i(p); 


END LOOP; 


ename:-'DUMMY'; 





END coll test; 


下 面 是 profiler 的 结果 。 


UNIT_NAME OCCURED 


COLL TEST 


COLL TEST 


COLL TEST 


COLL TEST 
COLL TEST 














TOT TIME LINE TEXT 





T .000341 

1 .000064 12 

1 .000037 13 
200002 24.293033 
200000 3.317925 
200000 2.196512 
200000 1.957762 
200000 1.446018 
200000 2.022522 
200001 .502567 
1 . 706513 

L 1.287485 

1 1.333679 

1 .000026 

1001 .001445 
1000 .007430 
1000 .005262 
1000 .004718 
1000 .006192 

2 .113792 


CURSOR big emp curs IS 
SELECT rownum, ename FROM big emp; 

















big emp cache t:-big emp ename t(' '); --to initilaize 
big emp cache v:-big emp ename v(' '); --to initilaize 

15 FOR be r IN big emp curs LOOP 

16 big emp cache t(be r.rownum):-be r.ename; 

17 big emp cache t.EXTEND; 

18 big emp cache v(be r.rownum):-be r.ename; 

19 big emp cache v.EXTEND; 

20 big emp cache i(be r.rownum):-be r.ename; 

21 ename:-'DUMMY'; 

24 SELECT COUNT(*) INTO cnt FROM big emp 

WHERE ename-'SCOTT'; 

26 SELECT COUNT(*) cache t INTO cnt 

30 SELECT COUNT(*) cache v INTO cnt 

34 ename:- big emp cache t(100000); 

35 FOR i in 1..1000 LOOP 

36 p:=100000+i; 

37 ename:- big emp cache t(p); 

38 ename:- big emp cache v(p); 

39 ename:- big emp cache i(p); 

42 ename:-'DUMMY'; 


big emp 表 有 200 000 行 记 录 ， 被 装载 进 一 个 内 存 数组 (VARRAY)、 一 个 PL/SQL 表 和 一 个 
索引 表 。 第 16—20 行 的 数据 表明 装载 时 间 比 较 长 ， 装 载 进 索引 表 的 时 间 最 短 ， 甚 次 是 VARRAY, 


最 慢 的 是 PL/SQL 循环 表 ， 比 索引 表 慢 3 倍 。 


从 第 37~39 行 可 以 看 出 访问 各 种 集合 类 型 的 速度 ,这 3 种 类 型 之 间 的 差别 不 是 很 大 ,VARRAY 


是 最 快 的 。 


从 查询 速度 来 看 ， 从 实际 表 中 查询 的 速度 最 快 , 它 比 从 内 存 表 中 查询 还 要 快 。 这 个 例子 并 不 
能 说 明 内 存 表 查询 慢 ， 只 是 可 以 说 明 在 某 些 情况 下 ， 内 存 表 不 一 定 是 最 佳 的 选择 。 





Z 


Hie 1 
SHARJA 任务 提前 














今天 终于 完成 了 南京 的 事情 ， 我 把 Streams 后 续 实验 的 任务 交 给 小 邓 后 ， 就 坐 飞 机 返回 沈 P 
了 。 今 天 运气 真 不 错 ， 在 机 场 居然 补 到 了 一 个 头等 舱 的 位 置 。 我 拿 的 是 深圳 航空 的 金 卡 ， 可 以 免 
费 升 舱 。 由 于 我 坐 的 航线 很 多 没有 头等 舱 ， 就算 偶尔 有 头等 舱 ， 也 经 常 由 于 我 到 机 场 比较 晚 ， 已 
经 无 法 升 和 能 了 。 这 还 是 我 第 一 次 坐 头等 舱 , 以 前 最 多 也 只 是 坐 过 商务 舱 , 头等 舱 的 位 置 确 实 舒 服 。 
在 做 一 个 大 项 目 时 ， 最 好 是 能 够 不 被 打 断 ， 持 续 地 做 下 去 。 我 离开 的 这 段 时 间 ， 沈 阳 这 边 发 
生 了 一 系列 事情 ， 所 以 我 需要 做 一 些 功课 才能 够 跟 得 上 进度 。 吃 过 丰盛 的 午饭 ,我 就 马上 打开 电 
脑 ， 查 看 老 于 和 老 能 发 过 来 的 资料 。 我 不 在 沈阳 的 一 个 星期 ， 老 于 他 们 的 进展 十 分 迅速 ， 主 要 的 
优化 思路 已 经 基本 形成 。25 日 开始 就 是 月 底 高 峰 了 ，25 日 到 下 个 月 10 日 这 段 时 间 是 我 们 分 析 系 
统 的 关键 时 段 , 在 这 个 时 段 里 我 们 必须 把 主要 的 问题 都 一 一 发 现 ,为 下 一 步 形成 优化 方案 打下 坚 
实 的 基础 。 

从 报告 上 看 ， 老 能 最 近 一 直 在 优化 一 个 通过 查询 管理 器 生成 出 来 的 SQL, 这 个 SQL 占 缓 冲 区 
获取 的 比重 超过 了 20%, 如 果 能 够 对 这 个 SQL 进行 优化 , 就 可 以 大 大 减轻 账 务 系统 的 CPU 消耗 。 
从 执行 计划 上 来 看 ， 由 于 这 个 SQL 是 由 一 个 查询 生成 器 生成 的 ， 而 开发 人 员 为 了 省 事 ， 使 用 了 
大 量 比如 where 1-1 and 1-0 and ... 这 样 的 占 位 操作 和 开关 操作 ， 并 且 这 个 SQL 由 7 张 表 组 
成 ， 其 中 5 张 是 超过 百 万 的 表 ，3 张 甚至 是 超过 千 万 的 表 。 经 过 几 天 的 分 析 ， 老 能 找到 了 解决 这 
个 问题 的 方法 ， 只 要 去 掉 占 位 操作 和 1=0、1=1 这 样 的 开关 ， 优 化 器 给 出 的 执行 计划 是 十 分 正确 
的 ， 整 个 SQL 的 开销 减少 了 95% 以 上 。 老 熊 发现 了 这 个 解决 方案 后 ， 十 分 兴奋 ， 立 即 和 老 于 一 
起 找 来 了 开发 厂商 的 技术 人 员 ， 一 起 讨论 这 个 优化 方案 。 不 过 在 开发 商 那 边 ， 又 遇 到 了 很 大 的 阻 
力 ， 经 过 讨论 后 ,开发 商 拒绝 做 出 修改 ， 理 由 是 如 果 去 掉 占 位 操作 ， 程 序 的 逻辑 就 复杂 多 了 ， 他 
们 的 开发 人 员 没 有 能 力 完成 这 个 改造 。 这 是 一 个 很 令 人 郁 间 的 结果 , 也 是 我 们 做 优化 过 程 中 经 常 
遇 到 的 结果 。 应 用 开发 人 员 最 不 愿意 做 的 就 是 修改 自己 的 应 用 。 

看 到 开发 厂商 的 态度 十 分 坚决 ， 老 于 和 老 能 也 没有 办 法 。 后 来 通过 私下 交流 才 了 解 到 ,这 个 
应 用 十 分 复杂 , 性 能 问题 也 是 大 家 早 就 有 所 认 知 的 , 不 过 由 于 最 初 开发 这 个 模块 的 人 早 就 离开 公 
司 了 ， 所 以 这 个 模块 一 直 没 有 人 敢 去 做 大 的 改动 ,哪怕 是 有 新 的 需求 ， 也 只 敢 通 过 占 位 符 和 开关 
变量 增加 几 个 开关 而 已 。 我 回 到 沈阳 时 , 老 能 正在 为 这 件 事 情 而 感到 十 分 郁 问 ， 老 于 也 是 满 脸 无 
奈 。 晚 上 凑 在 一 起 喝酒 ， 气 氛 也 不 是 很 好 。 如 何 协调 和 应 用 开发 厂商 的 关系 十 分 关键 。 按 照 原来 
的 计划 ，25 日 开始 是 信息 收集 的 关键 阶段 ， 我 们 要 完成 所 有 基线 数据 的 采集 ， 并 且 根 据 这 段 时 
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间 收 集 的 信息 , 在 下 个 月 10 日 前 完成 优化 方案 的 设计 。 不 过 由 于 客户 那 边 面临 的 压力 越 来 越 大 ， 
客户 希望 我 们 能 够 在 6 月 6 日 完成 第 一 次 优化 操作 ， 以 便 顺 利 度 过 6 月 8 日 开始 的 缴费 高 峰 。 老 
于 开始 的 时 候 也 强调 提前 优化 实施 对 整个 项 目的 影响 较 大 , 希望 能 够 按照 原来 的 计划 实施 , 不 过 
由 于 孙 主 任 那 边 实在 是 挺 不 住 了 ,直接 给 小 齐 打 电话 ， 要求 我 们 能 够 帮 他 们 个 忙 ， 提 前 做 一 些 调 
整 。 其 至 北方 公司 的 李 总 也 找到 小 齐 要 求 我 们 配合 辽宁 公司 尽快 做 一 次 调整 。 

既然 小 齐 已 经 答应 了 客户 ,那么 我 们 就 必须 认真 对 待 这 件 事 了 ,我 们 必须 为 此 调整 工作 计划 。 
这 种 节奏 的 变化 是 优化 工作 中 的 大 总 , 按部就班 地 实施 优化 是 十 分 必要 的 。 由 于 整体 优化 项 目 不 
同 于 普通 的 优化 , 这 是 一 个 系统 工程 , 每 个 步骤 都 依赖 于 前 一 个 步骤 的 成 果 , 如 果 优 化 实施 提前 ， 
那么 前 面 的 每 个 步骤 都 要 提前 。 虽 然 总 体 的 优化 思路 ， 我 和 老 于 已 经 基本 形成 ,但 是 其 中 的 很 多 
细节 需要 等 这 个 月 底 和 下 个 月 初 ， 甚 至 是 6 月 8 日 以 后 从 系统 分 析 中 获取 ,很 多 猜想 也 要 通过 后 
面 半 个 多 月 的 数据 分 析 来 验证 。 如 果 6 H 6 日 实施 了 部 分 优化 操作 , 那么 6 月 8 日 后 的 有 些 东西 
可 能 会 被 掩盖 ,这 里 面 如 果 存 在 一 个 严重 的 问题 被 我 们 忽略 了 , 那么 就 给 系统 埋 下 了 一 个 定时 炸 
弹 ， 这 个 炸弹 一 旦 爆炸 就 是 致命 的 。 如 果 爆 炸 时 正好 是 7 月 8 日 我 们 准备 验收 的 时 候 ， 那 么 7 月 
份 验收 计划 就 会 成 为 泡影 。 

还 有 一 点 我 十 分 顾虑 ， 那 就 是 目前 集成 商 的 SQL 优化 工作 基本 在 原 地 踏步 ， 如 果 6 月 6 日 
优化 实施 后 ， 系 统 性 能 有 所 改善 ， 那 么 集成 商 优化 SQL 的 力度 也 会 减弱 ， 这 样 就 更 不 利于 推动 
集成 商 修改 SQL 了 。 这 个 问题 老 于 今天 也 和 甲 方 提 出 了 ， 甲 方 的 态度 十 分 明确 ， 就 是 集成 商 的 
问题 我 们 不 用 管 ， 他 们 会 给 他 们 足够 的 压力 ， 不 会 因为 6 月 6 日 系统 性 能 改善 而 影响 SQL 优化 
工作 。 看 样子 6 月 6 日 的 优化 实施 势 在 必 行 了 ,过 多 的 坚持 没有 任何 意义 ， 因 为 客户 目前 的 处 境 
我 们 都 很 清楚 。 他 们 承受 的 压力 比 我 们 多 好 多 倍 ， 如 果 不 是 实在 支持 不 住 了 ， 他 们 也 不 会 不 顾 一 
切 地 要 求 我 们 提前 实施 。 

晚上 我 们 一 边 喝酒 一 边 研 究 6 H 6 日 的 优化 要 做 哪些 调整 , 由 于 6 H 7 日 我 还 要 到 大 连 开 一 
个 会 , 所 以 6 日 的 优化 工作 必须 滴水 不 漏 。 而 6 日 之 前 让 应 用 开发 厂商 完成 部 分 应 用 的 修改 工作 
已 经 是 不 可 能 的 了 。 我 们 在 6 月 6 日 实施 的 优化 项 目 中 ， 采 用 的 都 是 一 些 比较 保守 的 方案 ， 也 就 
是 副作用 比较 小 的 操作 ， 所 以 我 们 计划 6 日 的 优化 重点 分 为 以 下 几 个 方面 。 

OQ 大 表 分 区 ， 对 于 超过 10GB 的 大 表 ， 如 果 可 能 就 进行 分 区 。 

a 调整 部 分 索引 。 

O 对 主要 常用 索引 进行 重建 (通过 ALTER INDEX <...> REBUILD 或 者 ALTER INDEX <...> 
REBUILD ONLINE), 

a 调整 操作 系统 VM 相关 参数 。 

a 调整 部 分 Oracle 参数 。 

O 全 面 分 析 表 和 索引 。 

对 于 表 分 区 技术 的 使 用 ,我 们 几 个 都 有 十 分 丰富 的 经 验 ,， 不 过 以 往 做 表 分 区 ， 都 是 在 开发 人 
员 的 配合 下 完成 的 ， 这 一 次 我 们 将 脱离 开发 人 员 的 配合 独立 完成 ， 所 以 风险 会 加 大 很 多 ,并 且 需 
要 我 们 花 更 多 的 精力 来 分 析 应 用 才能 够 完成 。 因 为 目前 分 区 主键 的 选择 以 及 分 区 粒度 的 设计 完全 





















































80 Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





要 依靠 我 们 自己 的 经 验 来 设计 ， 所 以 分 区 主键 选择 的 合理 性 对 系统 性 能 改善 影响 极 大 。 

添加 索引 的 问题 ， 在 之 前 已 经 通过 SQL Analyzer 分 析 了 大 量 的 SQL， 形 成 了 几 十 个 索引 优 
化 的 建议 。 不 过 根据 我 们 前 一 阵子 对 索引 进行 的 监控 发 现 ， 还 有 1 000 多 个 索引 从 来 没有 用 过 ， 
是 否 要 删除 这 些 索 引 的 问题 ,就 没 那 么 容易 解决 了 。 虽 然 在 我 们 监控 的 这 段 时 间 里 ， 这些 索引 没 
有 用 过 , 然而 这 并 不 能 说 明 这 些 索 引 都 是 没有 任何 用 处 的 。 假设 每 个 月 只 有 少量 的 操作 用 到 了 某 
个 索引 ， 而 这 个 索引 又 被 我 们 删除 了 ， 如果 更 不 巧 的 是 使 用 这 个 功能 的 人 正好 是 领导 ,那么 麻烦 
就 大 了 。 以 我 的 经 验 ， 在 优化 项 目 实施 过 程 中 ,这 种 存在 一 定 风 险 的 操作 是 要 尽量 避免 的 。 从 另 
一 个 角度 上 看 , 实际 上 用 户 感觉 比较 慢 的 操作 或 者 消耗 系统 资源 比较 大 的 操作 , 往往 是 一 些 复杂 
的 查询 ， 而 不 是 INSERT 操作 ， 乱 建 索 引 会 增加 INSERT, DELETE 和 UPDATE 操作 的 开销 ， 影 响 
这 些 操作 的 性 能 。 而 从 目前 系统 的 整体 情况 来 看 ， 用 户 对 这 些 操作 的 性 能 并 不 敏感 ， 而 且 这 些 操 
作 占 系统 总 开销 的 比例 不 足 5%, 因此 我 们 没有 必要 冒 着 出 问题 的 风险 , 第 一 时 间 删 除 这 些 索引 。 
主要 是 因为 目前 开发 商 不 能 全 力 配合 ， 导 致 这 个 原本 很 容易 的 问题 变 得 复杂 起 来 。 通 过 协商 , 我 
们 决定 暂时 只 增加 索引 ， 而 不 做 删除 操作 。 

对 于 VM 参数 的 调整 ， 通 过 我 们 前 一 段 时 间 的 分 析 ， 已 经 发 现 maxperm% 等 参数 设置 有 明显 
的 不 合理 现象 ， 减 少 maxpermgs 的 值 ， 可 以 将 大 量 的 内 存 从 文件 缓冲 中 释放 出 来 ， 从 而 解决 系统 
负载 高 时 产生 大 量 换 页 的 问题 。 虽 然 说 Unix 操作 系统 的 文件 缓冲 可 以 在 需要 时 释放 ， 不 过 由 于 
Unix 系统 的 内 存 释 放 算 法 存在 问题 ， 这 种 听 起 来 很 不 错 的 机 制 其 实 是 存在 一 定 问 题 的 。 最 好 的 
方法 是 让 文件 缓冲 尽 可 能 少 地 占用 物理 内 存 ， 因 为 对 于 数据 库 服务 器 来 说 , 文件 缓冲 几乎 没有 什 
么 用 处 。 

调整 完 VM 相关 参数 后 , 物理 内 存 会 出 现 较 多 的 空间, 这 使 我 们 能 够 加 大 数据 库 缓 冲 池 、 共 
享 池 等 缓冲 池 的 大 小 。 我 们 决定 加 大 这 些 缓冲 池 ，, 但 这 个 操作 存在 较 大 风险 ， 因 为 在 业务 高 峰 期 
E, CPU 的 使 用 率 已 经 相当 高 了 ， 甚 至 严重 的 时 候 已 经 出 现 了 CPU 的 瓶 开 。 我 们 做 出 调整 这 些 
缓冲 池 的 决定 基于 综合 考虑 : 一 方面 是 通过 索引 的 优化 以 及 索引 重建 ， 提 高 索引 的 效率 , 减少 全 
表 扫 描 带 来 的 系统 开销 ; 一 方面 是 通过 表 分 区 减少 表 扫 描 以 及 索引 扫描 的 开销 ; 最 后 我 们 通过 对 
表 和 索引 进行 重新 分 析 ， 以 提高 基于 成 本 的 优化 器 (CBO) 的 效率 。 在 这 种 情况 下 ， 我 们 才 敢 于 
在 CPU 存在 明显 瓶颈 的 系统 上 增加 缓冲 池 的 大 小 。 另 外 ， 为 了 进一步 减少 CPU 的 开销 ， 我 们 决 
定 调整 游标 相关 参数 (包括 cursor sharing, session cached cursors 等 ) 来 减少 SQL 分 
析 带 来 的 CPU 开销 。 





















































2 水 今日 点 评 

DBA 在 做 SQL 优化 时 ， 经 常会 犯 一 个 错误 : 找 出 一 堆 开 销 较 大 的 SQL， 提交 给 开发 商 去 修 
改 。 这 是 做 优化 的 大 辟 。 开 发 商 需要 的 不 是 你 提交 一 堆 SQL 给 他 们 ， 而 是 需要 将 解决 方案 找 出 
来 交 给 他 们 。 甚 至 在 很 多 情况 下 ， 需 要 找 出 多 个 解决 方案 去 供 开 发 商 选 择 。 实 际 上 ， 在 一 个 优化 
项 目 中 ， 开 发 商 和 DBA 的 目标 应 该 是 相同 的 ， 而 往往 由 于 两 方 代表 的 单位 之 间 的 利益 冲突 造成 
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T DBA 和 开发 人 员 之 间 的 激烈 冲突 。 这 种 冲突 在 严重 的 时 候 会 影响 整个 优化 项 目 。 

开发 人 员 最 怕 的 是 DBA 的 优化 计划 给 他 们 带 来 很 大 的 工作 量 ， 因 此 在 应 用 优化 上 会 出 现 一 
定 的 抵触 情结 。 如 果 DBA 交 给 开发 人 员 的 优化 计划 十 分 容易 实现 ， 那 么 这 种 抵触 情绪 会 有 所 减 
弱 。 因 此 DBA 在 优化 项 目 中 ， 首 先 应 该 和 开发 人 员 建 立 起 一 种 良好 的 合作 关系 ， 并 在 制订 优化 
方案 时 尽 可 能 地 赫 开 发 人 员 考 虑 ,选择 一 些 比较 容易 实现 的 优化 方案 , 在 必要 的 时 候 需要 提供 多 
个 可 选 方案 供 开 发 人 员 选 择 。 如 果 能 够 做 到 这 点 ， 开 发 人 员 就 没有 任何 借口 来 为 自己 开脱 了 ， 这 
对 于 整个 优化 项 目 是 十 分 有 帮助 的 。 


mr Hellas) 占 位 操作 与 开关 操作 
I 占 位 操作 是 开发 人 员 常 用 的 一 种 编程 方法 ， 比 如 WHERE 条 件 是 动态 生成 的 ， 那 么 WHERE 后 
面 的 第 一 个 条 件 和 更 后 面 的 条 件 是 不 同 的 ，wHERE 后 的 第 一 个 条 件 前 面 没 有 任何 运算 符 , 而 后 面 
的 都 带 有 运算 符 ， 因 此 如 果 WHERE 变 为 WHERE 1=1， 那 么 后 面 的 所 有 条 件 都 有 运算 符 ， 编 程 就 
简单 很 多 。 实 际 上 占 位 操作 是 一 种 很 不 好 的 编程 习惯 ， 如 果 条 件 很 复杂 ， 又 大 量 使 用 占 位 操作 ， 
那么 会 导致 优化 器 无 法 获得 正确 的 执行 计划 。 

开关 操作 也 是 编程 人 员 常 用 的 一 种 编程 手段 ， 同 样 也 是 性 能 杀手 。 比 如 写 好 一 个 SQL 模板 ， 
其 中 有 一 个 开关 (1=:p1 and...)， 如 果 我 们 希望 后 面 的 and 起 作用 ， 那 么 pi 就 赋值 为 1， 如 
果 不 希 望 后 面 的 and 起 作用 ，pl 就 赋 韭 1 的 值 。 

对 较为 复杂 情况 的 应 用 来 说 ， 占 位 操作 和 开关 操作 可 以 提高 SQL 代码 的 重用 ， 简 化 SQL 的 
逻辑 关系 ,但 是 占 位 操作 可 能 带 来 严重 的 数据 库 性 能 问题 ,由 于 使 用 了 大 量 的 开关 变量 和 占 位 符 ， 
所 以 优化 器 很 容易 产生 错误 的 执行 计划 ， 增 加 SQL 的 成 本 。 实 际 上 ， 占 位 操作 完全 可 以 通过 应 
用 程序 的 逻辑 来 禁 代 。 在 应 用 软件 开发 过 程 中 , 尽量 不 要 为 了 请 足 复杂 的 逻辑 关系 而 编写 过 于 庞 
大 的 SQL。 通 过 程序 的 逻辑 控制 ,将 一 个 复杂 的 SQL 分 解 为 几 个 小 型 的 SQL 是 一 种 十 分 好 的 编 
程 习惯 。 由 于 开发 团队 往往 过 多 地 考虑 功能 上 的 实现 以 及 代码 的 重用 ， 而 无 法 考虑 到 维护 中 产生 
的 额外 成 本 ， 所 以 维护 团队 中 的 DBA 需要 给 开发 团队 的 开发 人 员 一 定 的 培训 ， 并 且 参 与 到 各 级 
评审 中 ， 尽 早 避 免 出 现 这 种 含有 大 量 开关 操作 和 占 位 操作 的 SQL, 


E 2 优 化 由 技巧 ) 优化 计划 调整 


作为 整体 优化 项 目 , 必须 有 一 个 十 分 严格 的 实施 计划 , 并且 计划 确定 后 , 一 定 要 严格 按照 计 
划 实 施 。 作 为 大 型 的 优化 项 目 ， 最 大 的 忌讳 就 是 经 常 调整 优化 计划 。 一 般 来 说 ,优化 计划 一 旦 形 
成 ， 就 要 尽 可 能 按照 计划 实施 ， 而 不 要 随意 提前 。 

在 优化 计划 里 , 一 般 来 说 第 一 次 实施 的 时 间 不 要 过 早 。 任何 对 系统 的 变更 都 可 能 隐藏 一 部 分 
系统 的 信息 ， 导 致 我 们 无 法 正确 掌握 系统 存在 的 实际 问题 ,其 至 可 能 把 这 些 隐患 遗留 下 来 。 在 优 
化 项 目前 期 ， 系 统 出 的 问题 越 多 越 好 ， 这 样 就 可 能 将 系统 的 主要 问题 全 部 抓 住 。 

不 过 一 般 来 说 , 来 自 客户 那 边 的 压力 是 很 大 的 ， 因此 经 常会 调整 优化 计划 。 最 常 碰 到 的 事情 
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就 是 客户 要 求 提前 进行 一 些 优化 操作 ,以 便于 缓解 系统 存在 的 瓶颈 。 实 际 上 这 种 要 求 是 对 优化 项 
目 危 害 最 大 的 ,但 是 很 多 情况 下 我 们 无 法 拒绝 客户 的 要 求 ， 就 像 我 们 在 沈阳 的 处 境 一 样 ， 客 户 实 
在 是 受 不 了 了 ,我 们 必须 提前 做 些 什 么 。 那 么 在 这 种 情况 下 ,我 们 尽 可 能 做 一 些 对 后 续 分 析 影 响 
较 小 的 操作 ， 尽 可 能 不 让 临时 性 的 优化 操作 掩盖 更 多 的 信息 。 下 面 几 件 是 可 以 做 的 事情 。 

a 通过 索引 调整 优化 某 些 SOL, 

a 重建 索引 以 提高 索引 的 性 能 (通过 REBUILD 或 者 删除 重建 的 方式 重建 索引 ) 。 

a 表 整 理 : 对 于 存在 较 多 碎片 的 表 进 行 重组 以 提高 表 访 问 的 性 能 

O 分 析 表 和 索引 : 对 表 和 索引 进行 全 面 的 分 析 以 提高 优化 器 的 准确 性 。 
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数据 库 空 间 管理 是 数据 库 中 最 重要 的 一 个 部 分 , 也 是 DBA 最 重要 的 职责 。DBA 会 在 数据 库 
空间 管理 上 花费 大 量 的 时 间 和 精力 .Oracle 9i 提供 的 新 的 数据 库 空 间 管理 机 制 可 以 大 大 减轻 DBA 
在 这 方面 的 工作 。ASSM 就 是 这 样 一 种 新 特性 。 在 Oracle 9i 之 前 的 数据 库 版 本 中 ， 段 空间 管理 是 
通过 freelists 结构 来 实现 的 ，DBA 在 创建 对 象 时 可 以 定义 freelists 和 freelist groups 
的 数量 。pctused 参数 决定 了 哪些 数据 块 存放 在 freelists 中 。 在 ASSM 机 制 中 ， 段 空间 管理 
是 通过 位 图 来 实现 的 。 位 图 的 状态 指出 每 个 块 中 空闲 空间 的 状态 (大 于 75%, 50967596. 25%~50% 
和 小 于 25% 这 4 种 状态 ) 。 在 新 的 段 空间 管理 模式 下 , freelists, freelist groups fil pctused 
的 管理 都 不 需要 了 ,减轻 了 DBA 的 工作 。 并 且 在 ASSM 机 制 下 ， 空 间 空 间 的 使 用 更 加 高 效 。 在 
ASSM 机 制 下 ， 并 发 DML 的 性 能 也 得 到 了 改善 ， 因 为 不 同 部 分 的 位 图 可 以 被 同步 使 用 ， 而 不 像 
freelists 那样 ， 只 能 支持 串 行 操作 。 

在 RAC 环境 下 ，ASSM 也 改善 了 RAC 的 性 能 。 在 ASSM 机 制 下 ， 各 个 市 点 不 需要 同步 
freelists 和 freelist groups， 节 省 了 这 方面 的 开销 。Oracle 内 部 的 基准 测试 结果 表明 ， 在 
一 个 双 节点 的 RAC 环境 下 ， 每 台 服 务 器 配置 6 个 336 MHz 的 CPU 和 4GB 内 存 。 在 这 个 测试 环 
iT, HA 300 条 记录 ， 使 用 ASSM 机 制 比 配置 了 8 个 freelist groups、20 个 freelists 
的 手工 模式 快 了 大 约 35%, 

ASSM 仅仅 在 本 地 管理 表 空 间 中 支持 。 在 创建 表 空 间 时 ， 加 入 SEGMENT SPACE MANAGEMENT 
子 句 允许 DBA 选择 段 空间 管理 模式 (AUTO 或 者 MANUAL)。 下面 的 例子 可 以 创建 一 个 使 用 ASSM 
的 表 空 间 : 


CREATE TABLESPACE data DATAFILE 
'/u02/oracle/data/data01.dbf' SIZE 50M 
EXTENT MANAGEMENT LOCAL 

SEGMENT SPACE MANAGEMENT AUTO; 


在 这 个 表 空 间 中 创建 的 所 有 对 象 都 会 使 用 ASSM 来 管理 空闲 空间 。 在 这 种 表 空 间 中 创建 或 
修改 对 象 的 属性 ， 所 有 的 pctused, freelists 和 freelist groups 参数 都 会 被 忽略 。 在 
dba tablespaces 视图 中 ， 增 加 了 一 个 字段 segment space management 指明 了 该 表 空 间 是 
否 使 用 ASSM。 要 使 用 ASSM，compatible 参数 需要 设置 为 9.0.0 或 者 更 高 。 
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今天 早上 刚 想 出 门 ,小 邓 的 电话 打 过 来 了 。 南 京 那 边 ODS 的 实验 全 部 完成 ,除了 发 现 当 Apply 
Handler 停止 工作 3 个 小 时 后 ， 生 产 库 出 现 了 较为 严重 的 共享 地 碎片 ， 大量 出 现 ORA-4031 错误 
外 , 其 他 一 切 测试 都 很 正常 。 针 对 ORA-4031 的 问题 , 通过 加 大 共享 池 空 间 也 得 到 了 很 大 的 缓解 。 
通过 一 系列 测试 ， 我 们 的 结论 是 : 在 Oracle 9.2.0.8 环境 下 ，Streams 工作 一 切 正常 ， 不 过 也 发 生 
过 Apply Handler 死 掉 的 情况 ， 后 来 编写 了 一 个 监控 程序 ， 如 果 发 现 Apply Handler 死 掉 就 自动 重 
启 , 整个 复制 过 程 就 很 正常 了 .从 上 述 试验 来 看 , 只 要 配 以 一 定 的 监控 手段 ,完全 可 以 避免 Streams 
给 生产 库 造 成 严重 影响 的 问题 。 我 马上 和 李 工 通 了 电话 ， 李 工 听 到 这 个 结果 后 也 十 分 高 兴 。 不 过 
由 于 我 们 的 测试 环境 是 Oracle 9.2.0.8, mH. Oracle 9.2.0.6 中 存在 几 个 Streams 的 bug， 因 此 我 们 
还 是 建议 客户 升级 到 Oracle 9.2.0.8。 

打 完 电话 ， 发 现 老 于 他 们 几 个 都 已 经 去 浑 南 找 张 工 他 们 讨论 SQL 优化 的 安排 了 。 今 天 的 安 
排 是 我 一 个 人 在 邮政 大 厦 值 班 ， 其 他 人 都 在 浑 南 总 部 ， 所 以 我 马上 打车 过 去 。 赶 到 办 公 室 时 已 经 
9 点 多 钟 了 ， 一 进门 ， 开 发 商 的 小 刘 就 迎 了 上 来 ， 房 间 里 还 有 几 个 开发 人 员 ， 正 围 在 那 台 监 控 电 
脑 旁 边 讨论 着 什么 ， 看 见 我 进来 ， 大 家 一 下 子 围 了 上 来 。 原 来 今天 早上 新 上 了 一 个 业务 模块 ， 其 
中 有 一 个 应 用 涉及 一 张 表 的 修改 , 要 从 一 张 表 中 将 未 处 理 的 记录 (STATUS='A01P' ) 取出 来 , 经 
过 处 理 后 ， 再 将 状态 位 修改 为 A01F'"。 只 有 少量 的 统计 查询 才 需 要 查找 A01F 的 数据 ， 这 种 查询 
只 占 所 有 查询 不 到 1%。 由 于 这 张 表 一 般 情况 下 有 500 万 左右 的 记录 ， 其 中 A01P 状态 的 记录 大 
约 在 几 百 条 到 一 千 条 , 因此 他 们 在 这 个 字段 上 设计 了 一 个 索引 , 这 个 应 用 在 测试 时 没有 任何 问题 ， 
但 是 今天 一 上 线 ， 就 发 现 出 现 大 量 ORA-60 错误 。 大 约 有 10% 左 右 的 业务 失败 ， 因 此 从 8 : 30 营 
业 厅 开业 以 来 , 营业 前 台 的 投诉 就 十 分 严重 ,其 至 有 些 营 业 厅 投诉 到 了 公司 老总 那 边 。 孙 主任 那 
边 也 感受 到 了 很 大 的 压力 ， 要 求 开 发 商 立 即 解决 。 

看 到 这 个 现象 ， 我 的 第 一 感觉 是 ， 他 们 是 不 是 使 用 了 位 图 索引 ， 因 为 位 图 索引 锁 住 的 不 止 是 
一 行 而 是 一 组 数据 ， 所 以 出 现 死 锁 的 可 能 性 大 大 增加 。 我 打开 了 一 份 ORA-60 Trace 文件 ， 查 看 
了 SQL 语句 和 锁 的 情况 ， 更 加 确定 了 我 的 怀疑 ， 估 计 是 位 图 索引 导致 的 问题 。 于 是 我 问 了 负责 
开发 的 小 王 ， 是 不 是 他 们 在 这 张 表 上 使 用 了 位 图 索引 。 小 王 想 了 想 ， 说 确实 是 。 我 说 位 图 索引 一 
HHE OLAP 系统 上 , 在 变化 频率 特别 高 的 环境 下 不 能 使 用 位 图 索引 ， 必 须 使 用 普通 索引 ， 否 则 
在 高 并 发 量 的 情况 下 ， 会 出 现 较 多 的 死 锁 ， 前 台 会 报 ORA-60 错误 。 

我 这 边 正在 和 小 王 讨论 如 何 优 化 , 避免 死 锁 的 问题 , 旁边 的 一 个 技术 人 员 立 即 删除 了 原 有 的 
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索引 ， 并 创建 了 一 个 B 树 索 引 。 创 建 B 树 索 引 后 ， 又 出 现 了 另外 的 问题 ，CPU 使 用 率 一 下 子 提 
高 到 100%， 整 个 系统 出 现 了 严重 的 性 能 问题 。 现 场 气氛 一 下 子 紧 张 了 起 来 ,现在 是 月 底 业务 高 
峰 期 ， 也 是 投诉 的 高 峰 期 ， 这 个 时 候 再 出 现 这 种 事情 ， 真 是 雪上 加 霜 。 通 过 v$session wait 
可 以 看 到 系统 出 现 了 大 量 的 db file scattered read， 看 样子 对 那 张 表 的 访问 开始 走 全 表 扫 
tii T. 

我 立即 要 求 开发 商 将 那个 出 问题 的 SQL 给 我 看 看 ， 我 希望 STATUS 字段 里 面 最 好 不 使 用 绑 
定 变量 。 如 果 没 有 使 用 绑 定 变量 ,那么 分 析 柱 状 图 后 可 以 使 用 这 个 索引 ， 这样 就 能 够 解决 这 个 问 
mA, AABN, STATUS 字段 恰恰 使 用 了 绑 定 变量 , 这 下 子 就 很 难 办 了 ， 因 为 绑 定 帘 视 (bind 
peeking) 可 能 会 导致 执行 计划 不 稳定 。 因 此 ， 制 订 如 下 方案 。 

(1) 首先 对 该 字段 分 析 柱 状 图 。 

(2) 分 析 完 毕 立 即 执 行 如 下 代码 : 


























ALTER SYSTEM FLUSH SHARED POOL; 
VAR PV VARCHAR2 (10); 

EXEC :PV:='A01P'; 

SELECT ssssss WHERE STATUS-:PV; 


执行 了 上 述 方案 后 ，CPU 使 用 率 大 幅度 下 降 了 ， 再 检查 那个 SQL 的 执行 计划 ， 发 现 确实 使 
AL PEWS, KRABI DAM PR, NARS OU Bete, 在 警告 日 志 里 已 经 看 
不 到 ORA-60 的 报错 了 ， 和 营业 前 台 也 没有 新 的 投诉 ， 看 样子 上 面 的 操作 是 成 功 的 。 小 王 追 着 我 问 
为 什么 要 做 第 (2) 步 。 关 于 绑 定 变量 和 绑 定 宕 视 ， 也 不 是 一 两 句 话 就 能 说 清楚 的 ， 我 只 好 说 这 是 
Oracle 的 内 部 机 制 决定 的 ， 并 且 建 议 他 们 尽快 修改 应 用 程序 ， 这 个 SQL 不 要 使 用 绑 定 变量 ， 因 
为 今天 的 小 手段 只 是 一 个 临时 性 的 措施 ,下 次 数据 库 重启 或 者 其 他 情况 下 可 能 还 会 出 问题 。 为 了 
保证 我 的 建议 能 够 被 完整 地 贯彻 下 去 , 我 打 了 个 电话 给 张 工 , 让 他 督促 一 下 小 王 他 们 ,最 好 今天 
晚上 就 把 应 用 改 好 部 署 上 去 。 张 工 说 , 最 好 我 能 提交 一 个 文档 以 我 们 和 局 方 的 名 义 一 起 提交 给 
发 小 组 ,我 看 了 看 目前 的 情况 , 也 确实 没有 时 间 去 写 什 么 正规 的 文档 了 , 看 看 小 王 还 在 办 公 室 
就 直接 又 和 他 叮嘱 了 一 得 。 为 了 让 他 更 加 重视 , 我 有 意 奔 大， 告诉 他 今天 的 临时 手段 只 能 应 付 一 
两 天 ， 如 果 他 们 不 修改 程序 ， 可 能 明 后 天 还 会 出 问题 。 小 王 听 说 后 立即 表态 , 今天 晚上 肯定 修改 
完毕 。DBA 这 活 确实 不 好 干 ， 为 了 达到 目的 ， 连 撒谎 的 伎俩 都 用 上 了 ， 我 感觉 答 上 有 些 发 烧 ， 
还 好 干 这 行 时 间 长 了 ， 脸 皮 也 厚 了 ， 小 王 应 该 是 看 不 出 来 的 。 

今天 是 月 底 账 期 开始 的 时 间 ， 一 般 来 说 月 底数 据 补 录 都 是 从 25 日 开始 的 。 所 以 今天 系统 的 
负载 一 直 都 很 大 ， 虽 然 刚 才 解 决 了 那个 全 表 扫 描 的 问题 ，CPU 的 使 用 率 仍然 很 高 ， 平 均 CPU 等 
待 队 列 一 直 在 100 以 上 。 做 了 一 个 cron 的 作业 , 每 隔 30 分 钟 采集 一 次 STATSPACK 采样 。 同 时 
通过 OEM 开启 了 平均 事务 响应 时 间 、Top SQL、 门 锁 分 析 和 VO 成 本 分 析 这 儿 个 图 表 , 并 且 对 每 
个 图 表 都 开启 了 自动 录像 。 

集成 商 的 小 孙 今 天 一 直 很 忙 ,不断 有 投诉 电话 打 进来 , 不 过 小 孙 也 没有 什么 办 法 。 我 打开 了 
BBS， 发 现今 天 的 帖子 倒 不 是 很 多 ， 不 过 内 容 越 来 越 尖锐 了 。 由 于 系统 的 性 能 问题 已 经 严重 影响 
了 营业 部 门 的 绩效 考核 ,而 绩效 成 绩 决定 了 每 个 人 的 收入 ,所 以 就 像 孙 主 任 说 的 ,， BBS 上 就 是 路 
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我 们 祖宗 八代 也 是 应 该 的 。 

下 午 系 统 还 是 那样 ，CPU 使 用 率 基 本 上 在 95% 以 上 ， 不 过 偶尔 还 能 看 到 一 些 IDLE， 通 过 
vmstat 看 到 的 可 运行 队列 一 直 在 50 一 100， 小 孙 那 边 的 电话 也 逐渐 少 了 ， 看 样子 系统 还 算 平 稳 。 
不 过 从 上 午 的 事情 可 以 看 出 ， 这 种 在 临界 状态 运行 的 系统 ， 随 时 都 有 出 事 的 可 能 ，6 日 的 优化 确 
实 也 是 没 办 法 的 办 法 了， 必须 做 点 事情 , 而 且 必 须 对 系统 有 较 大 的 调整 ， 否 则 这 个 系统 真 的 很 难 
说 能 不 能 撑 过 下 个 月 的 业务 高 峰 。 我 又 打开 优化 方案 , 认真 地 阅读 起 来 , 这 回 对 优化 方案 真 的 是 
要 多 下 一 些 工夫 了 。 

下 午 老 于 他 们 回 到 了 北 站 这 边 。 我 和 老 于 讲 了 上 午 的 事情 , 他 说 在 总 部 那 边 就 知道 这 边 出 事 
了 ， 孙 主任 刚刚 和 他 们 讲 了 个 开场 白 ， 就 被 叫 了 出 去 ， 然 后 就 没有 回来 。 后 来 听 张 工 阅 出 事 了 ， 
本 来 都 想 暂 停 会 议 ， 让 老 于 他 们 帮助 处 理 一 下 ， 后 来 知道 我 已 经 到 了 现场 并 且 在 处 理 了 ， 就 没有 
动手 。 不 过 中 午 吃 饭 时 我 们 在 食堂 里 磁 到 孙 主 任 ， 他 也 讲 了 这 个 事情 ， 并 且 感 谢 我 们 处 理 得 比较 
及 时 ， 帮 助 他 们 避免 了 一 次 大 事故 。 

我 和 老 于 两 个 人 坐 在 吸烟 区 一 边 喝 茶 一 边 抽烟 ,讨论 着 优化 方案 的 问题 , 昨天 我 提出 的 这 个 
优化 范围 是 根据 这 几 天 的 系统 分 析 以 及 以 往 的 经 验 做 出 的 。 一 般 来 说 , 这 些 调整 对 系统 的 副作用 
是 比较 小 的 ， 肯 定 会 使 系统 得 到 一 定 的 缓解 ， 不 过 由 于 这 个 系统 的 CPU 负载 相当 高 ， 而 且 服务 
器 比较 老 , 虽然 当年 购买 的 时 候 服务 器 的 档次 也 不 低 , 但 现在 看 来 配置 相当 低 , 其 中 有 一 套 P670 
才 配 了 2 CPU, 作为 一 个 省 级 运营 商 的 服务 器 ,确实 有 点 力不从心 。 基 于 这 个 考虑 ， 只 要 是 对 
减少 CPU 有 帮助 的 优化 手段 ， 我 们 都 要 考虑 。 

我 和 老 于 研究 了 一 下 SQL 分 析 的 问题 ， 觉 得 如 果 能 够 减少 SQL 分 析 ， 也 可 以 部 分 缓解 CPU 
的 使 用 率 。 实 际 上 ， 我 也 很 清楚 ,减少 分 析 ， 顶 多 能 减少 2%~3% 的 CPU 使 用 ， 不 过 蚊子 虽 小 
也 是 肉 啊 。 在 这 种 情况 下 ， 只 要 能 降低 CPU 使 用 率 的 方法 就 是 好 方法 。 通 过 分 析 应 用 ， 发 现 大 
量 的 SQL 都 没有 使 用 绑 定 变量 ， 如 果 将 cursor_sharing 调整 为 similar 可 以 部 分 达到 减少 
SQL 分 析 的 目的 。 


E" 人 优化 小 技巧 ) 倾斜 字段 的 处 理 


在 实际 工作 中 ,我 们 经 常会 碰 到 倾斜 性 的 字段 。 比 如 像 今 天 这 个 例子 , 在 500 万 条 记录 的 表 
HH, STATUS 字段 的 取 值 只 有 区 区 儿 个 。 在 这 种 情况 下 ， 大 家 可 能 想到 的 是 使 用 位 图 索引 ， 因 为 
普通 的 B 树 索引 由 于 键 值 取 值 范围 太 少 , 效率 不 高 。 不 过 位 图 索引 由 于 其 特殊 的 结构 ,操作 茶 个 
记录 时 , 会 锁 住 某 一 组 数据 , 而 不 是 像 普通 索引 那样 仅 锁 住 一 行 数据 , 因此 位 图 索引 往往 在 OLAP 
系统 中 使 用 ,不 适合 并 发 访问 十 分 高 的 OLTP 系统 ， 主 要 是 因为 位 图 索引 会 导致 锁 等 待 时 间 大 幅 
度 增加 ， 其 至 导致 死 锁 频 繁 出 现 。 

不 过 如 果 STATUS 字段 是 倾斜 的 ， 就 像 今天 的 例子 ，50P 的 值 很 少 ， 只 有 几 百 条 或 者 几 千 条 
记录 ,而 大 量 的 查询 操作 是 要 查 出 STATUS=' 50P' 的 记录 。 对 于 倾斜 的 列 ， 使 用 柱状 图 是 常用 的 
优化 方案 。 这 种 技术 使 某 列 只 有 少量 值 时 也 能 很 好 地 使 用 B 树 索引 。 但 是 在 这 种 情况 下 ， 最 好 不 
要 使 用 绑 定 变 量 ， 否 则 由 于 绑 定 宽 视 ， 可 能 导致 执行 计划 不 稳定 。 这 方面 在 Oracle 10g 使 用 了 新 
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的 绑 定 客 视 技术 后 有 所 改善 。 不 过 如 果 使 用 的 是 Oracle 9i， 建 议 还 是 在 这 种 情况 下 不 使 用 绑 定 变 
量 。 下 面 是 一 个 实际 的 案例 。 

该 系统 存在 严重 的 性 能 问题 ，IO 十 分 高 ，DB Cache 的 命中 率 不 足 50%。 经 分 析 ， 散 列 值 为 
1285325803 的 SQL 存在 严重 的 性 能 问题 。 通 过 SPREPSQL 分析: 





$ Snap 
Statement Total Per Execute Total 
Buffer Gets: 1,055,004 36,379.4 32.81 
Disk Reads: 1,000,975 34,516.4 46.02 
Rows processed: 159 5b 
CPU Time(s/ms): 113 3,889.3 
Elapsed Time(s/ms): 318 10,976.9 
Sorts: 29 1.0 
Parse Calls: 29 1.0 
Invalidations: 0 
Version count: 1 
Sharable Mem(K): 49 
Executions: 29 
SQL Text 
SELECT b.req name, b.cli pid, b.req id, b.svr name, b.timeout, b.svr module, 





b.svr inst, b.status, to char(b.req tm, 'YYYY MM DD HH24 MI SS'), 
nvl(a.default timeout,0) 

FROM service list a, service req list b 

WHERE 
a.app_id(+) = b.app id and 

a.svr_name(+) = b.svr name and 

b.status in ('Q','A') and 

b.app id = :v1 order by b.req tm,b.req id 


Known Optimizer Plan(s) for this Hash Value 

Shows all known Optimizer Plans for this database instance, and the Snap Id's 
they were first found in the shared pool. A Plan Hash Value will appear 
multiple times if the cost has changed 

-> ordered by Snap Id 


First First Plan 
Snap Id Snap Time Hash Value Cost 
167 24 Sep 08 16:57 74934330 40682 


Plans in shared pool between Begin and End Snap Ids 

Shows the Execution Plans found in the shared pool between the begin and end 
snapshots specified. The values for Rows, Bytes and Cost shown below are those 
which existed at the time the first-ever snapshot captured this plan - these 
values often change over time, and so may not be indicative of current values 
-» Rows indicates Cardinality, PHV is Plan Hash Value 

-> ordered by Plan Hash Value 
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Operation PHV/Object Name Rows Bytes Cost 
SELECT STATEMENT |. | | ]|----- 74934330 ----- 40682 
SORT ORDER BY 1M 190M 40682 

HASH JOIN OUTER 1M 190M 8355 

TABLE ACCESS FULL SERVICE REQ LIST 1M 147M 5641 
TABLE ACCESS BY INDEX ROWID SERVICE LIST 15 345 2 
INDEX RANGE SCAN PINX SERVICE LISTS A 1 HB 




















对 sERVICE REO LIST 的 全 表 扫 描 是 引起 性 能 问题 的 关键 。 该 表 有 100 多 万 条 记录 ， 其 中 
存在 下 列 过 滤 条 件 : 


b.status in ('Q','A') and 
b,app id = :v1 


经 检查 ,，b.app_id 的 值 域 只 有 一 个 值 , 无 选择 性 。 而 b.status 只 有 很 少 的 值 ， 具体 如 下 : 


SOL» SELECT STATUS,COUNT(*) FROM acsdba.service req list GROUP BY status; 
S COUNT (* ) 





入 2 
C 2304679 
E 367 
Q 1 


冬运 的 是 , 该 SQL 查找 的 STATUS IN('Q' ，'A') 的 记录 只 有 几 条 。 因 此 ，STArUS 上 的 创建 
索引 可 以 有 效 减少 全 表 扫 描 。 经 检查 发 现 ， 在 status 字段 上 已 经 创建 了 索引 ， 但 是 该 索引 并 没 
有 起 作用 ， 检 查 后 发 现 是 由 于 没有 分 析 柱 状 图 引起 的 。 通 过 下 列 脚本 重新 分 析 该 表 : 


exec DBMS STATS.GATHER TABLE STATS (ownname=>'acsdba', tabname=>'service req list', 
estimate percent-»20, - 
method o» pt=>'for all indexed columns size skewonly',cascade=>true, degree-»2); 


分 析 后 检查 执行 计划 ， 如 下 : 























Operation PHV/Object Name Rows Bytes Cost 
SELECT STATEMENT |----- 10932168 ----- 25 
SORT ORDER BY 1 102 25 

NESTED LOOPS OUTER 1 102 5 

INLIST ITERATOR 

TABLE ACCESS BY INDEX ROWID SERVICE_REQ_LIST 1 79 4 
INDEX RANGE SCAN RINX SERVICE REQ$ LI 1 3 

TABLE ACCESS BY INDEX ROWID SERVICE LIST 1 23 Al 
INDEX UNIQUE SCAN UINX_SERVICE_LISTS_A 1 





发 现 全 表 扫 描 已 经 消除 ， 通 过 5 月 25 日 上 午 的 验证 ， 系 统 的 整体 性 能 有 了 较 大 提升 。 


置信 优化 小 技 瑟 ) 自动 段 存储 空间 管理 2 
下 面 通过 一 个 例子 来 研究 Oracle 是 如 何 通过 位 图 来 管理 空闲 空间 的 。 首 先 创建 一 个 表 空 间 ， 
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具体 代码 如 下 : 


create tablespace t1 

datafile '/data/ora9/test.dbf ' 
size 50m 

EXTENT MANAGEMENT LOCAL 
SEGMENT SPACE MANAGEMENT AUTO ; 


通过 查询 dba_tablespaces， 可 以 确认 表 空 间 的 属性 具体 如 下 所 示 : 


SQL>select tablespace name , extent management , segment space management from 
dba tablespaces ; 











TABLESPACE NAME EXTENT MAN SEGMEN 
SYSTEM LOCAL MANUAL 
UNDOTBS1 LOCAL MANUAL 
TEMP LOCAL MANUAL 
CWMLITE LOCAL AUTO 
DRSYS LOCAL AUTO 
EXAMPLE LOCAL AUTO 
ODM LOCAL AUTO 
TOOLS LOCAL AUTO 
USERS LOCAL AUTO 
XDB LOCAL AUTO 
CIQEMS LOCAL MANUAL 
TABLES PACE_NAME EXTENT_MAN SEGMEN 
CREATEAM LOCAL MANUAL 
OUERLI LOCAL MANUAL 
TBS DB LOCAL MANUAL 
T LOCAL AUTO 











15 rows selected. 
从 上 面 可 以 看 出 ，t1 表 空 间 是 lmt 表 空 间 ， 段 空间 管理 是 AUTO 状态 的 。 为 了 测试 方便 ， 
下 面 建立 两 个 账号 ， 分 别 使 用 tl1 和 cigens 作为 默认 表 空 间 : 


SQL> create user bmb t1 identified by b default tablespace t1; 
User created. 

SQL> create user bmb t2 identified by b default tablespace ciqems; 
User created. 

SQL> grant connect,resource to bmb t1; 

Grant succeeded. 

SQL> grant connect ,resource to bmb t2; 

Grant succeeded. 


在 两 个 账号 分 别 创建 一 张 表 ， 代 码 如 下 : 
create table test bmb (a integer,b varchar2(100)); 
并 通过 PL/SQL 块 插 入 数据 ， 如 下 : 


begin 
for b in 1..10 loop 
for i in 1..500 loop 





T 





SH25H 倾 儿 的 索引 字段 89 





insert into test bmb values 
end loop; 
end loop; 
end; 
/ 


在 这 两 个 账号 中 ， 分 别 对 表 进 行 分 析 : 
analyze table test bmb compute statistics; 


通过 系统 用 户 连 接 数 据 库 ， 然 后 查询 : 


(i,to_char (i*b*1234)); 


SQL> SELECT owner,blocks, 


empty blocks FROM dba tables 


2 WHERE table name-'TEST BMB'; 
OWNER BLOCKS EMPTY BLOCKS 
BMB T2 12 3 
BMB_T1 13 3 


可 以 看 出 , 同样 的 块 大 小 , 同样 的 数据 , 在 不 同 段 管理 模式 的 表 空 间 中 出 现 了 不 一 致 的 结果 。 
使 用 dbms. space.unused space 存储 过 程 去 进行 测试 ， 结 果 如 下 : 


SOL» set serveroutput on 
SOL» declare 



































2 TOTAL BLOCKS number; 
3 TOTAL BYTES number; 
4 UNUSED_BLOCKS number; 
5 UNUSED_BYTES number; 
6 LAST USED EXTENT FILE ID number; 
7 LAST USED EXTENT BLOCK ID number; 
8 LAST USED BLOCK number; 
9 begin 
10 dbms space.unused space('BMB T1', 'TEST BMB', 'TABLE', 
11 TOTAL BLOCKS, TOTAL BYTES, UNUSED BLOCKS, UNUSED BYTES, 
12 LAST USED EXTENT FILE ID, LAST USED EXTENT BLOCK ID, 
13 LAST USED BLOCK); 
14 dbms output.put line('OBJECT NAME - FREELIST T'); 
15 dbms output.put line('----------------------------------- tjes 
16 dbms output.put line('TOTAL BLOCKS - '||TOTAL BLOCKS); 
17 dbms output.put line('UNUSED BLOCKS - '||UNUSED BLOCKS); 
18 dbms output.put line('LAST USED BLOCK = '||LAST USED BLOCK); 
19 end; 
20 / 
OBJECT NAME - FREELIST T 
TOTAL BLOCKS = 16 
UNUSED_BLOCKS = 0 
LAST_USED_BLOCK = 8 


PL/SQL 过 程 已 成 功 完成 。 
SQL> declare 


2 TOTAL BLOCKS number; 
3 TOTAL BYTES number; 
4 UNUSED BLOCKS number; 
5 UNUSED BYTES number; 
6 LAST USED EXTENT FILE ID number; 
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7 LAST USED EXTENT BLOCK ID number; 
8 LAST USED BLOCK number; 
9 begin 
10 dbms space.unused space('BMB T2', 'TEST BMB', 'TABLE', 
11 TOTAL BLOCKS, TOTAL BYTES, UNUSED BLOCKS, UNUSED BYTES, 
12 LAST USED EXTENT FILE ID, LAST USED EXTENT BLOCK ID, 
13 LAST USED BLOCK); 
14 dbms output.put line('OBJECT NAME - FREELIST T'); 
15 döms output pub Sie (i= === TÍ Us 
16 dbms output.put line('TOTAL BLOCKS - '||TOTAL BLOCKS); 
17 dbms output.put line('UNUSED BLOCKS - '||UNUSED BLOCKS); 
18 dbms, output.put line('LAST USED BLOCK - '||LAST USED BLOCK); 
19 end; 
20 / 
OBJECT NAME - FREELIST T 
TOTAL BLOCKS - 16 
UNUSED BLOCKS = 3 
LAST USED BLOCK = 5 
PL/SQL 过 程 已 成 功 完成 。 








从 上 面 的 例子 可 以 看 出 ， 使 用 两 种 段 空间 管理 模式 时 ， 数 据 存储 方式 也 不 同 。 使 用 ASSM, 
16 个 数据 块 中 都 存储 了 数据 ， 而 使 用 手工 管理 模式 时 ， 有 3 个 块 是 在 freelists 上 的 。 对 于 手 
工 管理 模式 ， 总 计 占 用 了 16 个 块 ， 其 中 一 个 块 存储 段 头 信息 ，15 个 块 存储 数据 ， 因 此 从 
DBA TABLES 中 会 看 到 少 了 一 块 。 由 于 ASSM 模式 改变 了 空 闪 块 的 概念 ， 所 以 使 用 
dbms space.unused space 得 到 的 信息 不 能 说 明 问 题 。 

通过 一 个 新 的 存储 过 程 可 以 查看 ASSM 表 空 间 中 的 空间 使 用 情况 ， 这 个 存储 过 程 就 是 
dbms_space.space_usage。 下 面 用 这 个 存储 过 程 来 检查 TEST BMB 的 空间 使 用 情况 : 


SQL> declare 
2 v unformatted blocks number; 
v unformatted bytes number; 
v fsi1 blocks number; 
v fs1 bytes number; 
v fs2 blocks number; 
v fs2 bytes number; 
v. fs3 blocks number; 
v. fs3, bytes number; 
v fs4 blocks number; 
v fs4 bytes number; 
v full blocks number; 
v. full bytes number; 
begin 
dbms space.space usage ('BMB T1', 'TEST BMB', 'TABLE', 
v unformatted blocks, 
v unformatted bytes, v fsl1 blocks, v fs1 bytes, v fs2 blocks, v fs2 by 
tes, 
18 v fs3 blocks, v fs3 bytes, v fs4 blocks, v fs4 bytes, v full blocks, v 
. full bytes); 
19 dbms output.put line('Unformatted Blocks - '||v unformatted blocks); 
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20 dbms output.put line('FS1 Blocks = '||v £s1 blocks); 
21 dbms output.put line('FS2 Blocks = '||v. £s2 blocks); 
22 dbms output.put line('FS3 Blocks = '||v. £s3. blocks); 
23 dbms output.put line('FS4 Blocks = '||v. £s4 blocks); 
24 dbms output.put line('Full Blocks = '||v full blocks); 
25 end; 

26 / 

Unformatted Blocks - 0 

FS1 Blocks = 0 

FS2 Blocks = 0 

FS3 Blocks = 0 

FS4 Blocks = 2 

Full Blocks = 11 


PL/SQL 过 程 已 成 功 完成 。 
可 以 看 出 ， 这 个 结果 与 表 分 析 后 从 DBA_TABLES 中 获得 的 结果 一 致 。 目 前 系统 中 有 11 个 满 
的 块 ，2 个 超过 75% 的 块 ，3 个 空 
在 上 面 的 结果 中 ，FS1 ~FS4 的 定义 如 下 。 
a FSI; 0%~25% 空间 使 用 率 。 
a FS2; 25%~50% 空间 使 用 率 。 
a FS3: 50%~75% 空间 使 用 率 。 
a FS4; 7596— 100% 空间 使 用 率 。 
为 什么 会 有 3 个 空 块 呢 ? 下 面 我 们 就 来 揭 开 这 3 个 块 的 秘密 。 为 了 更 有 针对 性 ,我 们 继续 通 
it PL/SQL 块 来 增加 数据 ， 然 后 通过 doa extents 视图 查看 扩展 (EXTENT) 的 情况 : 


SQL> COL SEGMENT NAME FORMAT A30 TRUNCATE; 
SQL> SELECT segment name,extent id,file id,block id 




















2 FROM dba extents WHERE segment name = 'TEST BMB' AND OWNER-'BMB T1'; 
SEGMENT NAME EXTENT ID FILE ID BLOCK ID 
TEST BMB 0 4 9 
TEST BMB 1 4 17 
TEST BMB 2 4 25 
TEST_BMB 3 4 33 
TEST_BMB 4 4 41 
TEST_BMB 5 4 49 
TEST_BMB 6 4 57 
TEST_BMB 7 4 65 
TEST BMB 8 4 73 
TEST BMB 9 4 81 
TEST BMB 10 4 89 
SEGMENT NAME EXTENT ID FILE ID BLOCK ID 
TEST BMB 11 4 97 
TEST BMB 12 4 105 
TEST BMB 13 4 113 
TEST BMB 14 4 121 
TEST BMB 15 4 129 
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从 14 号 文件 的 1 


TEST BMB 16 14 137 
TEST_BMB 17 14 265 








可 以 看 出 ，TEST_BMB 有 18 个 扩展 ,第 一 个 是 从 14 号 文件 的 BLOCK. ID-9 开始 的 , 第 二 个 是 





alter system dump datafile 14 block 9; 
alter system dump datafile 14 block 10; 
alter system dump datafile 14 block 11; 


下 面 是 转 储 的 内 容 : 


Start dump data blocks tsn: 22 filet: 14 minblk 9 maxblk 9 
buffer tsn: 22 rdba: 0x03800009 (14/9) 

scn: 0x0000.00f8ecb8 seq: 0x02 flg: 0x04 tail: Oxecb82002 
frmt: 0x02 chkval: 0x26cf type: 0x20-FIRST LEVEL BITMAP BLOCK 
Dump of First Level Bitmap Block 


nbits : 4 nranges: 2 parent dba:  0x0380000a poffset: 
unformatted: 0 total: 16 first useful block: 3 
owning instance : 1 


instance ownership changed at 12/01/2004 12:10:26 
Last successful Search 12/01/2004 12:10:26 
Freeness Status: nfl 0 nf2 0 nf3 0 nf4 0 


Extent Map Block Offset: 4294967295 

First free datablock : 16 

Bitmap block lock opcode 0 

Locker xid: : 0x0000.000.00000000 

Highwater::  0x00000000 ext#: 0 blk#: 0 ext size: 

#blocks in seg. hdr's freelists: 0 

#blocks below: 0 
mapblk  0x00000000 offset: 0 
HWM Flag: Not Set 


0x03800009 Length: 8 Offse 
0x03800011 Length: 8 Offse 


0:Metadata 1:Metadata 2:Metadata 3: FULL 
4:FULL 5:FULL 6:FULL 7:FULL 
8:FULL 9:FULL 10: FULL 11:FULL 
12: FULL 13: FULL 14:FULL 15:FULL 
End dump data blocks tsn: 22 file#: 14 minblk 9 maxblk 9 
Start dump data blocks tsn: 22 file#: 14 minblk 10 maxblk 10 
buffer tsn: 22 rdba: 0x0380000a (14/10) 
scn: 0x0000.00f8ee7c seq: 0x01 flg: 0x00 tail: 0xee7c2101 
frmt: 0x02 chkval: 0x0000 type: 0x21=SECOND LEVEL BITMAP BLOCK 
Dump of Second Level Bitmap Block 























BLOCK ID-17 开始 的 。 下 面 我 们 来 分 析 14 号 文件 的 9、10、11 这 3 个 块 : 


number: 12 nfree: 2 ffree: 10 pdba: 0x0380000b 


opcode: 0 
xid: 
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L1 Ranges 
0x03800009 Free: 1 Inst: 
0x03800019 Free: 1 Inst: 
0x03800029 Free: 1 Inst: 
0x03800039 Free: 1 Inst: 
0x03800049 Free: 1 Inst: 
0x03800059 Free: 1 Inst: 
0x03800069 Free: 1 Inst: 





0x03800079 Free: 1 Inst: 
0x03800089 Free: 1 Inst: 
0x0380008a Free: 1 Inst: 


0x03800109 Free: 5 Inst: 
0x0380010a Free: 5 Inst: 








End dump data blocks tsn: 22 filet: 14 minblk 10 maxblk 10 
Start dump data blocks tsn: 22 filet: 14 minblk 11 maxblk 11 
buffer tsn: 22 rdba: 0x0380000b (14/11) 

scn: 0x0000.00f8ee7c seq: 0x02 flg: 0x00 tail: 0xee7c2302 
frmt: 0x02 chkval: 0x0000 type: 0x23-PAGETABLE SEGMENT HEADER 
Extent Control Header 








Extent Header:: sparel: 0 Spare2: 0 #extents: 18 #blocks: 
last map 0x00000000 #maps: 0 offset: 2716 
Highwater::  0x03800149 ext#: 17 blk#: 64 ext size: 128 


#blocks in seg. hdr's freelists: 0 
#blocks below: 306 
mapblk  0x00000000 offset: 17 
Unlocked 

Low HighWater Mark 

Highwater::  0x03800089 ext#: 15 blk#: 8 ext size: 8 
blocks in seg. hdr's freelists: 0 
blocks below: 118 
mapblk  0x00000000 offset: 15 
Level 1 BMB for High HWM block: 0x03800109 
Level 1 BMB for Low HWM block: 0x03800079 
Segment Type: 1 n12: 1 blksz: 8192 fbsz: 0 
L2 Array start offset:  0x00001434 
First Level 3 BMB:  0x00000000 
L2 Hint for inserts:  0x0380000a 
Last Level 1 BMB:  0x0380010a 
Last Level II BMB:  0x0380000a 
Last Level III BMB:  0x00000000 





384 


Map Header:: next  0x00000000 #extents: 18 obj#: 34180 flag: 0x20000000 


Extent Map 
0x03800009 length: 
0x03800011 length: 
0x03800019 length: 
0x03800021 length: 
0x03800029 length: 
0x03800031 length: 
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0x03800039 length: 8 

0x03800041 length: 8 

0x03800049 length: 8 

0x03800051 length: 8 

0x03800059 length: 8 

0x03800061 length: 8 

0x03800069 length: 8 

0x03800071 length: 8 

0x03800079 length: 8 

0x03800081 length: 8 

0x03800089 length: 128 

0x03800109 length: 128 

Auxillary Map 

Extent 0 L1 dba: 0x03800009 Data dba:  0x0380000c 
Extent 1 L1 dba: 0x03800009 Data dba:  0x03800011 
Extent 2 L1 dba: 0x03800019 Data dba:  0x0380001a 
Extent 3 L1 dba: 0x03800019 Data dba:  0x03800021 
Extent 4 L1 dba:  0x03800029 Data dba:  0x0380002a 
Extent 5 L1 dba: 0x03800029 Data dba:  0x03800031 
Extent 6 L1 dba: 0x03800039 Data dba:  0x0380003a 
Extent 7 L1 dba: 0x03800039 Data dba:  0x03800041 
Extent 8 L1 dba: 0x03800049 Data dba:  0x0380004a 
Extent 9 L1 dba: 0x03800049 Data dba:  0x03800051 
Extent 10 L1 dba: 0x03800059 Data dba:  0x0380005a 
Extent 11 L1 dba: 0x03800059 Data dba:  0x03800061 
Extent 12 L1 dba: 0x03800069 Data dba:  0x0380006a 
Extent 13 L1 dba: 0x03800069 Data dba:  0x03800071 
Extent 14 L1 dba: 0x03800079 Data dba:  0x0380007a 
Extent 15 L1 dba: 0x03800079 Data dba: 0x03800081 
Extent 16 L1 dba: 0x03800089 Data dba: 0x0380008b 
Extent 17 L1 dba: 0x03800109 Data dba: 0x0380010b 




















DBA 1: 0x0380000a 
End dump data blocks tsn: 22 filet: 14 minblk 11 maxblk 11 


可 以 看 出 第 一 个 块 (9 号 块 ) 保 存 了 一 个 LI BMB (一 级 位 图 块 ) ,第 二 个 块 保存 了 一 个 L2 BMB 
(二 级 位 图 块 )， 第 三 个 块 是 段 头 信息 。 
Oracle 位 图 的 结构 是 : 每 个 Ll BMB 包含 16 个 数据 块 的 位 图 信息 ， 如 下 所 示 : 


0:Metadata 1:Metadata 2:Metadata 3: FULL 
4:FULL 5: FULL 6:FULL 7:FULL 
8:FULL 9:FULL 10: FULL 11:FULL 
12:FULL 13:FULL 14:FULL 15:FULL 


在 L2 BMB 中 存放 了 L1 BMB 的 地 址 ， 而 在 L3 BMB 中 存放 了 L2 BMB 的 地 址 。 在 段 头 块 
(第 三 个 块 ) rh, f£ f L3 BMB 和 L2 BMB 的 相关 信息 。 如 下 所 示 : 


Segment Type: 1 n12: 1 blksz: 8192 fbsz: Ü 
L2 Array start offset:  0x00001434 

First Level 3 BMB: 0x00000000 

L2 Hint for inserts:  0x0380000a 
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Last Level 1 BMB: 
Last Level II BMB: 
Last Level III BMB: 


在 这 部 分 信息 中 ， 包 含 了 第 一 个 L3 BMB 的 地 址 (这 里 是 0， 表 示 没 有 L3 BMB) 以 及 最 后 


一 个 各 级 BMB 的 地 址 。 通 过 这 个 信息 ，Oracle 数据 库 可 以 掌握 所 有 位 图 
问 都 得 到 了 解释 。 但 是 为 什么 一 个 LI BMB 只 存放 16 个 块 的 位 图 呢 ? 
图 呢 ? 如 果 使 用 32KB 的 块 大 小 ， 那 么 不 是 很 浪费 吗 ? 在 段 头 信息 中 


起 来 好 像 很 简单 ,所 有 的 疑 
为 什么 不 存放 64 个 块 的 位 
有 一 张 扩展 表 的 数据 引起 了 我 们 的 注意 ， 如 下 : 





Extent Map 





0x0380010a 
0x0380000a 
0x00000000 





块 的 地 址 信息 。 


0x03800009 
0x03800011 
0x03800019 
0x03800021 
0x03800029 
0x03800031 
0x03800039 
0x03800041 
0x03800049 
0x03800051 
0x03800059 
0x03800061 
0x03800069 
0x03800071 
0x03800079 
0x03800081 
0x03800089 
0x03800109 








length: 


Auxillary Map 


OO OO OO OO OO CO OO OO CO CO CO CO © CO CO 


P o0 
N 
Oo 


Extent 
Extent 
Extent 
Extent 
Extent 
Extent 
Extent 
Extent 
Extent 
Extent 
Extent 1 
Extent 1 
Extent 1 
Extent 1 
Extent 1 
Extent 1 
Extent 1 
Extent 1 


AO OO -10|U0U E QO N FF o 





NOU OO N PF O 








0x03800009 
0x03800009 
0x03800019 
0x03800019 
0x03800029 
0x03800029 
0x03800039 
0x03800039 
0x03800049 
0x03800049 
0x03800059 
0x03800059 
0x03800069 
0x03800069 
0x03800079 
0x03800079 
0x03800089 
0x03800109 





0x0380000c 
0x03800011 
0x0380001a 
0x03800021 
0x0380002a 
0x03800031 
0x0380003a 
0x03800041 
0x0380004a 
0x03800051 
0x0380005a 
0x03800061 
0x0380006a 
0x03800071 
0x0380007a 
0x03800081 
0x0380008b 
0x0380010b 





lini 





事情 看 
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第 17 次 扩展 开始 ，length 变 成 了 128。 通 过 Auxillary Map 也 可 以 看 到 ， 从 第 17 次 扩展 
as ee 8 块 ， 而 是 128 块 。 由 于 T1 表 空 间 设置 为 AUTOALLOCATE， 所 以 默认 的 扩 





展 大 小 为 1MB， 表 示 BMB TEST 的 INITIAL=NEXT=64KB, 24 BMB TEST 扩展 16 次 后 ， 总 的 空 


间 超过 1MB， 因 此 下 次 扩展 时 ， 系 统 自动 使 用 IMB 进行 扩展 。 如 果 表 的 INT 


超过 表 空 间 统 一 扩展 大 小 时 ， 系统 按照 表 空间 统一 扩展 大 小 来 扩展 空间 , 而 不 是 按照 表 设 定 的 值 


来 扩展 空 











e x 17 次 扩展 开始 ，length 变 成 了 128 块 (1MB). 








TIAL 和 NEXT 设置 


另外 ， 从 这 张 表 中 可 以 清楚 地 看 到 每 次 扩展 的 位 图 信息 存放 的 地 址 以 及 数据 开始 块 的 地 址 。 


ie 对 于 Extent 2, L1 BMB 的 地 址 是 0x19， 数 据 是 0x1a， 就 是 下 一 





快 。 而 Extent 16 


的 Ll BMB 的 地 址 是 0x89 , 而 数据 是 Ox8b, 而 不 是 我 们 推算 的 0x9a。 为 什么 会 出 现 这 种 情况 呢 ? 
0x8a 中 又 会 有 什么 新 的 发 现 呢 ? 下 面 就 是 0x89 和 Ox8a 的 数据 。 


ALTER SYSTEM DUMP DATAFILE 14 block 137; 
ALTER SYSTEM DUMP DATAFILE 14 block 138; 


转 储 的 结果 如 下 : 











Start dump data blocks tsn: 22 file#: 14 minblk 137 maxblk 137 


buffer tsn: 22 rdba: 0x03800089 (14/137) 

scn: 0x0000.00f8eele seq: 0x04 flg: 0x00 tail: Oxeele2004 
frmt: 0x02 chkval: 0x0000 type: 0x20=FIRST LEVEL BITMAP BLOCK 
Dump of First Level Bitmap Block 


nbits : 4 nranges: 1 parent dba:  0x0380000a poffset: 
unformatted: 0 total: 64 first useful block: 2 
owning instance : 1 


instance ownership changed at 12/01/2004 13:17:49 
Last successful Search 12/01/2004 13:17:49 
Freeness Status: nfl 0 nf2 0 nf3 0 nf4 0 


Extent Map Block Offset: 4294967295 
First free datablock : 64 

Bitmap block lock opcode 0 

Locker xid: : 0x0000.000.00000000 


Highwater::  0x00000000 ext#: 0 blk#: 0 ext size: 


#blocks in seg. hdr's freelists: 0 
#blocks below: 0 

mapblk 0x00000000 offset: 0 

HWM Flag: Not Set 











0x03800089 Length: 64 Offset: 0 
0:Metadata 1:Metadata 2:FULL 3: FULL 
4:FULL 5:FULL 6:FULL 7:FULL 

8:FULL 9:FULL 10: FULL 11:FULL 
12:FULL 13: FULL 14:FULL 15:FULL 
16:FULL 17: FULL 18:FULL 19:FULL 

20: FULL 21:FULL 22:FULL 23: FULL 




















0 
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End dump data blocks tsn: 22 filets: 14 minblk 137 maxblk 137 
*** 2004-12-01 13:44:21.979 

Start dump data blocks tsn: 22 filet: 14 minblk 138 maxblk 138 
buffer tsn: 22 rdba: 0x0380008a (14/138) 

scn: 0x0000.00f8ee7c seq: 0x02 flg: 0x00 tail: 0xee7c2002 
frmt: 0x02 chkval: 0x0000 type: 0x20-FIRST LEVEL BITMAP BLOCK 
Dump of First Level Bitmap Block 











nbits : 4 nranges: 1 parent dba:  0x0380000a poffset: 9 
unformatted: 0 total: 64 first useful block: 0 
owning instance : 1 


instance ownership changed at 12/01/2004 13:17:56 
Last successful Search 12/01/2004 13:17:56 
Freeness Status: nfl 0 nf2 0 nf3 0 nf4 0 


Extent Map Block Offset: 4294967295 

First free datablock : 64 

Bitmap block lock opcode 0 

Locker xid: : 0x0000.000.00000000 

Highwater::  0x00000000 ext#: 0 blk#: 0 ext size: 0 

#blocks in seg. hdr's freelists: 0 

#blocks below: 0 
mapblk 0x00000000 offset: 0 
HWM Flag: Not Set 


0x038000c9 Length: 64 Offset: 0 


0: FULL 1:FULL 2:FULL 3:FULL 
4:FULL 5:FULL 6: FULL 7:FULL 
8:FULL 9:FULL 10:FULL 11:FULL 
12:FULL 13:FULL 14:FULL 15:FULL 
16:FULL 17:FULL 18:FULL 19:FULL 
20:FULL 21:FULL 22:FULL 23:FULL 
24:FULL 25:FULL 26:FULL 27:FULL 
28:FULL 29:FULL 30:FULL 31:FULL 
32:FULL 33:FULL 34:FULL 35:FULL 
36:FULL 37:FULL 38:FULL 39:FULL 
40:FULL 41:FULL 42:FULL 43:FULL 
44:FULL 45:FULL 46:FULL 47 :FULL 
48:FULL 49:FULL 50:FULL 51:FULL 
52:FULL 53:FULL 54:FULL 55:FULL 
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End dump data blocks tsn: 22 files: 14 minblk 138 maxblk 138 

原来 这 两 个 数据 块 都 是 L1 BMB, fE 0x89 块 中 可 以 看 到 ， 这 个 位 图 中 有 2 个 元 数据 块 ， 就 
是 0x89/0x8a。 在 这 两 个 块 中 存放 了 128 个 块 的 位 图 信息 。 从 上 面 的 信息 我 们 可 以 进行 如 下 的 推 
LI BMB 不 是 固定 的 1 块 ， 而 是 根据 每 次 扩展 的 块 的 数量 来 确定 。 
每 组 L1 BMB 至 少 能 够 存储 1 次 扩展 的 数据 的 位 图 。 
每 个 LI BMB 至 少 存储 16 个 块 的 位 图 。 
每 个 LI BMB 最 多 存储 64 个 块 的 位 图 。 

下 面 我 们 通过 一 系列 实验 来 证 明 这 个 推断 。 首 先 创 建 一 张 表 ， 设 置 INITIAL 为 2MB ， 然 后 
对 段 头 进行 分 析 。 

为 了 便于 分 析 ， 我 们 创建 了 一 个 新 的 表 空 间 T2, 


CREATE TABLESPACE T2 
DATAFILE '/data/ora9/T2.dbf' SIZE 50M 
EXTENT MANAGEMENT LOCAL 
UNIFORM SIZE 2048K 
SEGMENT SPACE MANAGEMENT AUTO; 


fÉ BMB TI 用 户 下 ， 执 行 下 列 脚本 ， 创 建 一 张 测 试 表 : 


DROP table test bmb; 
CREATE table test bmb (a integer,b varchar2(100)) 
storage(initial 2M) tablespace t2; 


在 系统 用 户 下 ， 可 以 通过 daa extents 视图 查询 该 表 的 扩展 信息 ， 从 中 找到 文件 号 


JL 
(file id) 和 块 号 (block_id): 
SQL> COL SEGMENT_NAME FORMAT A30 TRUNCATE; 


SQL> SELECT segment name,extent id,file id,block id 
2 FROM dba extents WHERE 








口 
口 
口 
口 














3 segment name = 'TEST BMB' AND OWNER-'BMB T1'; 
SEGMENT NAME EXTENT ID FILE ID BLOCK ID 
TEST BMB 0 15 9 


将 15 号 文件 9~14 块 转 储 出 来 ， 可 以 看 出 一 共有 6 个 元 数据 块 ， 其 中 Ll1BMB4 块 、L2 BMB 1 
块 以 及 段 头 2 块 。 从 上 面 的 例子 可 以 证 明 前 面 的 推断 ， 转 储 相关 数据 的 脚本 如 下 : 


ALTER SYSTEM DUMP DATA FILE15 block min9 block max 14; 


5 


5 月 26 日 A 优化 方案 





6 月 6 日 要 进行 第 一 次 优化 实施 ， 现 在 我 们 的 时 间 也 不 多 了 。 这 几 天 必须 继续 监控 系统 ， 
为 这 几 天 是 月 底 业 务 高 峰 期 , 大 量 的 补 单 操作 会 给 系统 负载 带 来 较 大 的 影响 ,而 这 几 天 的 观察 可 
能 会 带 来 一 些 新 的 发 现 。 除 了 监控 以 外 , 还 有 一 件 十 分 紧迫 的 事情 ， 就 是 必须 马上 做 出 一 个 切实 
可 行 的 优化 方案 。 优 化 方案 还 要 经 过 开发 商 的 审核 ， 并 且 和 甲 方 一 起 确认 ， 这 都 需要 时 间 ， 我 们 
在 后 面 的 10 天 里 能 够 完成 这 些 工 作 吗 ? 如 果 要 在 6 月 6 日 顺利 实施 第 一 批 优化 ， 我 们 必须 在 这 
个 星期 完成 整个 第 一 期 优化 方案 。 并 且 为 了 配合 优化 实施 , 在 6 月 6 日 实施 之 前 ， 必 须 优 化 更 多 
的 SQL, 使 CPU 开销 尽 可 能 多 地 下 降 。 看 样子 老 能 这 几 天 就 不 能 参与 优化 方案 设计 了 ， 他 必须 
加 快 优化 一 些 SQL, 开发 商 修改 应 用 的 难度 较 大 , 老 能 这儿 天 优化 的 重点 也 放 在 了 能 够 通过 添加 
索引 进行 优化 的 SQL 上 面 。 

由 于 昨天 的 突 发 事件 浪费 了 一 天 的 宝贵 时 间 , 所 以 今天 必须 将 优化 方案 的 框架 确定 下 来 , 然 
后 分 工 准备 。 老 能 正在 紧张 地 分 析 SQL, 老 肖 也 在 分 析 热 点 对 象 。 我 和 老 于 坐 在 吸烟 区 ， 每 个 人 
抱 着 一 大 杯 茶 水 ， 吗 着 香烟 ， 讨 论 着 初步 的 优化 方案 。 根 据 目 前 对 系统 的 分 析 结 果 ， 我 们 必须 在 
6 月 6 日 解决 以 下 几 个 问题 。 

(1) 需要 解决 系统 物理 内 存 不 足 的 问题 。 从 目前 情况 来 看 ，IO 系统 的 负载 过 高 ， 存 储 子 系统 
的 响应 速度 是 正常 值 的 几 倍 。 因 为 系统 较为 复杂 ， 存 储 系统 比较 老 ， 并 且 容 量 也 存在 不 足 ， 所 以 
基本 没有 从 存储 系统 本 身 解决 问题 的 可 能 性 , 而 最 有 效 的 应 用 优化 工作 又 进展 缓慢 除了 应 用 优 
化 和 存储 优化 之 外 ， 解 决 VO 问题 的 方法 是 要 增加 DB Cache 的 大 小 ， 因 此 必须 从 操作 系统 获取 
更 多 的 物理 内 存 。 通 过 前 一 段 时 间 的 分 析 , 大 约 有 30% 一 40% 的 物理 内 存 被 操作 系统 文件 缓冲 占 
用 ， 这 是 因为 maxperm% 参 数 使 用 了 默认 的 80%。 通 过 调整 maxperm% 参 数 ， 可 以 让 操作 系统 释 
放大 量 的 物理 内 存 ， 从 而 为 DB Cache 扩容 提供 有 利 的 条 件 。 我 们 建议 将 maxperm% 调 整 为 10%， 
minperm% 调 整 为 5%。 

(2) 为 了 解决 目前 的 IO 性 能 问题 ， 必 须 加 大 DB Cache， 同 时 ， 由 于 系统 总 的 物理 内 存 十 分 
有 限 ， 除 了 加 大 default 池 的 大 小 外 ， 为 了 能 够 提高 DB Cache 的 性 能 ， 我 们 建议 客户 启用 keep 
池 。 启 用 keep 池 是 提高 DB Cache 性 能 、 减 小 IO 数量 的 最 常用 的 办 法 。 在 我 以 前 做 过 的 优化 案 
例 中 , 每 次 使 用 这 个 方法 都 取得 了 不 错 的 效果 。 之 前 老 肖 已 经 分 析 了 一 些 表 和 索引 ， 准 备 了 一 个 
可 以 放 入 keep 池 对 象 的 清单 。 我 们 可 以 通过 ALTER 命令 修改 表 和 索引 的 属性 ， 把 常用 的 对 象 放 
到 keep 池 中 。 
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(3) 加 大 DB Cache 后 势必 增加 CPU 的 开销 ， 因 此 必须 采取 一 定 的 措施 将 CPU 的 使 用 率 降 下 
来 。 减 少 CPU 开销 的 最 佳 方法 是 SQL 优化 ， 但 是 从 开发 商 目前 的 进展 来 看 ,在 6 H 6 日 提交 一 
些 成 果 的 可 能 性 很 小 ,因此 我 们 决定 从 两 方面 入 手 : 一 方面 是 对 几 张大 表 进 行 分 区 ， 这 几 张 大 表 
产生 的 逻辑 读 和 物理 读 占 到 整个 系统 的 80% 以 上 , 通过 分 区 ,可 以 减少 大 量 不 必要 的 逻辑 读 和 物 
理 读 ， 男 一 方面 是 重新 设计 对 系统 性 能 影响 较 大 的 SQL 相关 表 的 索引 ， 提 高 整个 系统 的 效率 ， 
减少 缓冲 区 获取 的 数量 ， 这 部 分 工作 由 老 能 承担 。 还 有 一 个 屡 试 不 夹 的 减少 CPU 开销 的 办 法 是 
把 所 有 的 索引 都 重建 一 遍 ， 这 样 可 以 消除 索引 碎片 ， 减 少 索 引 大 小 ， 从 而 提高 索引 使 用 的 效率 。 
前 几 天 我 分 析 索 引 时 ， 居 然 发 现 有 一 张 表 本 身 只 有 30 多 焰 字 市 ， 主 键 索引 的 大 小 就 超过 SOMB, 
这 种 索引 如 果 重 建 一 下 , 估计 可 能 缩小 到 几 兆 字 闻 。 另 外 就 是 对 于 访问 比较 频繁 的 中 等 大 小 和 较 
小 的 表 ， 如 果 这 些 表 存在 较 多 的 碎片 ， 那 么 通过 碎片 整理 ， 也 可 以 减少 缓冲 区 获取 的 数量 ， 从 而 
降低 CPU 的 使 用 率 。 

(4) 调整 共享 池 以 及 相关 的 参数 ， 减 少 硬 分 析 的 消耗 。 由 于 本 系统 硬 分 析 很 严重 ， 大 概 消 耗 
T 5% 一 10% 的 CPU 资源 ， 所 以 调整 共享 池 可 以 少量 减少 CPU 的 消耗 ， 同 时 提高 系统 效率 。 由 
于 本 系统 中 绝 大 多 数 SQL 没有 使 用 绑 定 变量 ， 所 以 在 共享 池 优 化 方面 ， 我 们 准备 将 
cursor sharing 从 目前 的 exact 调整 为 similar， 另 外 准备 启用 session cached cursors 
(目前 这 个 参数 为 0， 这 个 时 候 会 话 的 游标 缓冲 未 被 启用 ) ， 将 这 个 参数 设置 为 100。 

O 对 所 有 的 表 和 索引 进行 一 次 30% 采 样 的 全 面 分 析 , 解决 目前 部 分 SQL 执行 计划 不 正确 的 
问题 。 虽 然 30% 采 样 比较 大 ， 对 于 绝 大 多 数 表 来 说 ，10% 采 样 就 能 够 保证 执行 计划 的 准确 性 了 。 
但 是 我 们 一 方面 缺乏 测试 环境 来 测试 最 小 采样 比例 ， 另 一 方面 时 间 紧 迫 也 没 办 法 逐一 测试 , 所 以 
只 能 选择 这 个 相对 比较 安全 的 采样 比例 。 

(6) 还 必须 注意 排队 效应 。 排 队 效 应 是 优化 工作 中 经 常 遇 到 的 一 个 问题 。 如 果 针 对 一 个 没有 
瓶颈 的 系统 或 者 是 一 个 封 困 的 “黑匣子 ”， 是 不 会 出 现 排队 效应 的 。 举 个 例子 ， 如 果 在 某 个 单位 
时 间 内 系统 负载 是 不 变 的 ， 那 么 任何 一 个 优化 动作 都 可 能 会 带 来 好 处 。 而 对 于 一 般 的 生产 系统 ， 
由 于 资源 瓶颈 出 现 性 能 问题 的 系统 ,往往 会 产生 大 量 的 业务 积压 ， 也 就 是 排队 。 当 系统 性 能 提升 
时 ， 这 些 积压 的 排队 事务 就 会 消 入 ， 导 致 系 统 负载 上 升 ， 而 当 负 载 上 升 到 某 一 个 国 值 时 ， 系 统 党 
源 将 会 出 现 新 的 瓶颈 ， 从 而 导致 系统 性 能 恶化 ,将 优化 的 成 果 完 全 消耗 列 尽 ， 甚 至 将 性 能 拉 回 优 
化 前 的 状态 。 因 此 ， 我们 在 第 一 批 实施 时 ， 必 须 考 虑 排队 效应 ,我 们 做 的 优化 必须 足以 抵消 排队 
效应 带 来 的 负面 影响 ， 否 则 本 次 优化 注定 要 失败 。 因 此 ,我 们 6 月 6 日 实施 的 力度 要 足够 大 ， 最 
关键 的 是 要 大 幅度 减少 CPU 的 开销 。 

我 和 老 于 两 个 人 一 边 喷 云 吐 雾 一 边 核对 这 个 优化 方案 。 从 目前 来 看 , 这 个 实施 方案 应 该 是 很 
周密 和 可 行 的 。 两 个 人 反复 对 着 写 着 草稿 的 纸 看 了 几 遍 ,感觉 应 该 没有 什么 问题 了 。 下 一 步 就 要 
看 明天 的 三 方 沟 通 会 上 开发 厂商 能 否 支 持 这 个 方案 了 。 如 果 开 发 商 不 支持 这 个 优化 方案 , 那么 由 
于 目前 CPU 存在 上 瓶颈， 我们 这 个 优化 的 成 败 就 取决 于 表 分 区 、 索 引 优化 和 表 分 析 这 三 招 的 效果 
了 。 如 果 这 三 个 手段 不 能 将 缓冲 区 获取 降低 20% 以 上 , 那么 这 个 方案 就 存在 一 定 的 风险 了 。 如 果 
由 于 排队 效应 ， 导 致 优化 后 CPU 出 现 上 瓶颈， 那么 这 次 调整 可 能 会 起 不 到 应 有 的 效果 ， 甚 至 可 能 
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出 现 系统 性 能 不 升 反 降 的 不 利 局 面 。 如 果真 的 出 现 了 这 种 情况 ,我 们 能 否 完成 这 个 项 目 都 成 问题 
了 。 优 化 项 目 做 到 一 半 就 被 客户 赶 回 家 的 案例 还 是 挺 多 的 。 

我 刚 把 这 个 疑虑 说 出 来 ， 老 于 也 皱 了 皱眉 ， 最 后 无 奈 地 说 :“ 爱 谁谁 吧 ， 如 果 开 发 商 不 配合 ， 
就 只 能 请 集团 公司 死 压 他 们 了 。” 连 老 于 这 样 的 老实 人 都 说 出 “ 爱 谁谁 ”的 话 来 ， 开 发 商 真是 把 
我 们 逼 得 够 惨 了 。 目 前 这 个 优化 方案 的 关键 点 就 是 表 分 区 、 索 引 优化 、 表 碎片 整理 等 操作 能 否 使 
CPU 的 使 用 率 下 降 20%。 说 实在 的 ， 我 还 是 比较 担心 排队 效应 ， 实 际 上 我 们 并 不 清楚 营业 厅 的 
实际 情况 ， 如 果 优 化 实施 后 ， 平 均 每 秒 的 事务 数量 提高 一 至 两 倍 都 是 可 能 的 。 如 果 SQL 优化 不 
同步 进行 ,那么 优化 后 如 果 平 均 事务 数量 提高 了 一 倍 以 上 ,， 则 由 于 排队 事务 的 谓 入 ， 可 能 导致 系 
统 负载 出 现 超过 30% 以 上 的 增加 ， 此 时 我 们 通过 优化 节省 下 来 的 20% 的 CPU 容量 很 可 能 被 新 涌 
入 的 事务 完全 消耗 光 。 这样 优化 的 效果 就 很 难保 证 了 。 可 能 会 出 现 忙 了 半天 系统 却 没 有 什么 改善 
的 情况 。 如果 发 生 这 种 情况 , 现在 十 分 支持 我 们 的 孙 主 任 还 会 继续 支持 我 们 吗 ? 前 几 天 小 齐 打 电 
话 来 说 另外 一 个 试点 一 一 山西 那 边 的 优化 项 目 陷 入 了 困境 ,我 们 的 竞争 对 手 做 了 两 次 优化 ， 都 没 
有 达到 预定 的 效果 ,反而 出 了 几 次 系统 故障 。 山 西 的 客户 已 经 决定 停止 优化 项 目 ， 宣 布 优化 失败 
了 。 山 西 的 情况 给 我 们 融 响 了 警钟 ， 我 们 千 万 不 能 重 蹈 覆 国 。 
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今天 的 日 记 中 提 到 了 一 个 比较 陌生 的 名 词 “ 排 队 效 应 ”。 好 像 这 也 不 是 一 个 正规 的 术语 ， 是 
我 自己 在 优化 实践 中 发 现 的 ， 用 了 一 个 比较 形象 的 词 来 形容 。 刚 刚 开 始 从 事 优化 工作 的 DBA 往 
往 会 陷入 一 个 误区 ， 就 是 认为 系统 的 负载 是 基本 稳定 的 ,在 这 种 前 提 下 ,做 任何 一 项 优化 工作 都 
是 积极 的 , 很 少 会 产生 负面 效应 。 而 事实 却 截然 相反 , 经 常会 出 现 做 了 优化 反而 性 能 下 降 的 情况 。 
其 实 我 们 优化 时 经 常会 发 现 ,优化 后 平均 事务 响应 时 间 会 有 所 提升 ， 每 秒 处 理 的 事务 更 多 了 ， 每 
秒 产生 的 重 做 量 更 大 了 ， 缓 冲 区 获取 (buffer get), 、 缓 冲 区 写 (buffer write) 也 相应 增加 了 。 对 于 
各 种 系统 资源 较为 充裕 的 系统 ， 排 队 效 应 对 优化 的 影响 不 会 很 大 ， 系 统 优化 后 ， 各 种 资源 得 到 了 
充分 的 发 挥 ， 虽 然 系统 的 CPU、 内 存 和 VO 资源 的 使 用 率 都 有 所 增加 ， 但 并 不 会 出 现 资源 瓶颈 。 
可 是 对 于 存在 较为 严重 资源 瓶颈 的 系统 ， 排 队 效 应 需要 被 充分 考虑 。 

实际 上 ， 当 某 个 影响 系统 性 能 的 等 待 事件 减少 了 , 平均 每 秒 处 理 的 事务 量 就 增加 了 , 忙 时 集 
中 系数 ( 忙 时 集中 系数 最 早 被 电信 运营 商 使 用 ， 其 含义 是 最 忙 的 1 小 时 内 处 理 的 业务 量 占 全 天 
24 小 时 的 百分比 ， 比 如 忙 时 集中 系数 是 0.1， 那 么 最 忙 的 一 个 小 时 处 理 的 业务 量 是 全 天 平均 值 的 
24 fi) 增加 了 ， 那 么 对 于 系统 资源 的 消耗 肯定 会 有 所 增长 。 如 果 某 个 资源 存在 瓶 须 ， 那 么 这 种 
优化 可 能 导致 存在 瓶颈 的 资源 消耗 增 大 ,如 果 该 资源 的 消耗 增 大 到 出 现 过载 的 情况 ,系统 性 能 会 
急剧 下 降 ， 使 系统 的 整体 性 能 不 会 提升 反而 会 下 降 。 

上 面 说 的 是 系统 中 的 排队 效应 ,是 一 种 系统 内 部 的 逻辑 排队 。 对 于 存在 营业 前 台 的 营业 系统 ， 
还 有 一 个 实际 物理 上 的 排队 。 如 果 优化 前 的 平均 事务 响应 时 间 是 3s, 那么 一 个 营业 员 可 能 每 分 钟 
可 以 处 理 2 笔 业 务 ， 营 业 窗 口 可 能 排 起 几米 长 的 了 从， 而 如 果 系 统 响应 时 间 提 升 为 ls 了 ， 那 么 一 
个 营业 员 可 能 每 分 钟 可 以 处 理 3 笔 业 务 ， 那 么 系统 在 业务 最 系 忙 时 段 的 念 时 集中 系数 会 大 幅 增 
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加 ， 对 系统 资源 的 需求 会 大 幅 增 大 ， 这 时 很 可 能 导致 某 个 资源 比较 紧张 的 系统 出 现 过 载 ， 甚 至 出 
现 系统 崩溃 。 

以 前 处 理 过 一 个 优化 项 目 ， 当 时 也 是 遇 到 了 资源 十 分 紧张 的 情况 ， 系 统 十 分 缓慢 ,我 建议 客 
户 每 个 营业 厅 关 闭 一 个 窗口 ， 虽 然 每 个 窗口 排 的 队 更 长 了 ,但 关闭 了 一 些 终端 ， 系 统 资源 的 消耗 
下 降 ， 每 个 营业 窗口 处 理 业 务 的 速度 大 幅 提升 ， 平 均 每 个 客户 的 等 待 时 间 反 而 下 降 了 。 


P'S) DB Cache 调整 方案 如 何 制订 


今天 做 优化 方案 时 谈 到 了 通过 加 大 DB Cache 来 提升 系统 性 能 。 这 个 优化 方案 看 上 去 好 像 很 
简单 ， 但 是 为 什么 要 加 大 DB Cache? 加 大 以 后 会 带 来 多 大 的 好 处 ?这 是 怎么 评估 出 来 的 ?大 家 
可 能 很 容易 通过 命中 率 来 判断 DB Cache 是 否 足 够 ,我 也 经 常 看 DB Cache 的 命中 率 。 而 从 调 优 
的 角度 来 看 ， 命 中 率 是 十 分 粗略 的 东西 ， 只 能 作为 参考 。 

很 多 文档 都 说 DB Cache 的 命中 率 要 超过 9596, 否则 需要 加 大 DB Cache, Oracle 公司 的 多 个 
健康 检查 的 脚本 把 命中 率 定 为 90%。 到 底 DB Cache 的 命中 率 多 少 合适 呢 ? 这 个 问题 恐怕 无 解 。 
不 同 的 系统 在 不 同 的 情况 下 对 命中 率 的 要 求 是 不 同 的 。 除 了 考虑 命中 率 指标 外 ，DB Cache 设置 
是 否 合理 主要 取决 于 当前 的 DB Cache 大 小 是 否 产生 了 过 多 的 物理 IO ,导致 了 物理 VO 负载 过 大 ， 
以 及 是 否 加 大 了 相关 的 门 锁 竞 争 ， 导 致 了 DB Cache 相关 的 性 能 问题 。 而 且 ， 如 果 使 用 了 多 缓冲 ， 
简单 的 命中 率 并 不 能 说 明 问 题 , 不 同 缓冲 区 的 命中 率 都 是 需要 分 别 计算 的 , 否则 无 法 得 到 某 个 缓 
冲 区 的 实际 命中 率 。 对 于 keep ih, 我 们 的 命中 率 目标 是 100% ， 如 果 低 于 100% ， 就 说 明 keep jt 
过 小 。 在 很 多 情况 下 ，keep 池 的 命中 率 低 于 99% 就 可 能 存在 较为 严重 的 问题 了 。 

更 高 级 一 点 的 分 析 是 通过 OW! (Oracle Wait Interface) 去 分 析 ， 看 看 哪些 等 待 事件 是 最 为 严 
重 的 ， 是 不 是 存在 较为 严重 的 IO 等 待 ， 如 何 能 够 减少 IO 等 待 ， 从 而 提高 系统 性 能 。 如 果 系 统 
中 的 db file sequence read 等 待 十 分 严重 ， 那 么 是 不 是 能 够 加 大 DB Cache 来 减少 这 方面 的 等 待 ， 
从 而 提高 性 能 呢 ? 哪怕 命中 率 达 到 了 98%， 加 大 DB Cache 可 能 仍然 能 够 取得 较 好 的 优化 效果 。 
通过 OWI 分 析 可 以 从 等 待 事件 、 门 锁 等 情况 分 析 DB Cache 的 设置 是 否 存 在 问题 。 

如 果 你 已 经 熟练 掌握 了 OW! 分 析 ， 那 么 下 一 步 应 该 学 习 更 高 级 的 分 析 方 法 ， 就 是 一 种 从 
系统 整体 出 发 的 分 析 方 法 。 结 合 OWI、 时 间 模 型 、 系 统 综合 分 析 ， 从 系统 优化 的 角度 来 分 析 
DB Cache 是 否 需 要 调整 。 做 数据 库 优 化 ， 实 际 上 是 对 系统 的 CPU、 内存、LO 资源 进行 优化 组 
合 。 这 三 者 之 间 的 关系 如 下 所 示 。 

Q 加 大 DB Cache (内 存 )， 可 以 减少 WO， 但 是 会 增加 CPU 的 消耗 。 

a 减少 DB Cache， 可 以 增加 1O， 减少 CPU 的 消耗 。 

一 个 优秀 的 DBA 应 该 能 够 在 调整 时 ， 充 分 考虑 系统 资源 的 限制 ， 在 使 任何 一 种 资源 都 不 出 
现 短 板 的 情况 下 提高 系统 的 总 吞吐 能 力 。 如 果 当 前 系统 的 IO 响应 时 间 很 正常 ，IO 性 能 很 好 ， 
那么 加 大 DB Cache 对 系统 整体 性 能 的 提升 是 微乎其微 的 。 而 对 于 一 个 VO 相对 出 现 了 瓶颈 的 系 
统 ， 加 大 DB Cache 往往 可 以 获得 较 好 的 性 能 改善 。 而 对 于 一 个 CPU 已 经 十 分 紧张 的 系统 ,盲目 
加 大 DB Cache, 可 能 会 导致 严重 的 性 能 问题 。 一 名 优秀 的 DBA 应 该 对 这 些 有 一 个 综合 性 的 评估 。 
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作为 DBA， 应 该 十 分 清楚 自己 所 做 的 优化 目的 是 什么 。 是 提高 整个 系统 的 吞吐 能 力 ， 还 是 
提高 某 个 业务 模块 的 响应 速度 ? 在 系统 资源 很 充分 的 时 候 , 提高 某 个 模块 的 响应 速度 是 没有 多 大 
难度 的 ， 但 是 如 果 系 统 资源 很 紧张 ， 片 面 去 提高 某 个 模块 的 性 能 可 能 会 带 来 很 恶劣 的 结果 。 

很 多 DBA 总 是 通过 一 些 所 谓 的 理论 来 支持 自己 的 工作 。 实 际 上 做 优化 和 练武 术 一 样 ， 练 习 
招 术 是 很 初级 的 阶段 ， 到 了 某 个 阶段 ， 无 招 胜 有 招 。 如 果 达 到 了 这 种 境界 ， 对 系统 进行 任何 操作 
都 能 确保 结果 是 好 的 。 

举例 来 说 ， 我 的 一 个 客户 有 个 业务 ， 即 对 一 张 超过 1GB 的 表 频 繁 进 行 随机 访问 ， 而 且 这 个 
随机 访问 要 求 的 响应 时 间 十 分 严格 。SQL 是 最 优 的 了 , 但 是 响应 速度 仍然 达 不 到 要 求 。 考 虑 到 当 
时 CPU 使 用 率 还 较 低 (不 到 50%), 内 存 也 有 大 量 的 空间 , 我 建议 将 这 张 表 和 相关 索引 放 入 keep 
ih, 这 样 操作 后 , 系统 响应 时 间 达 到 了 客户 的 要 求 , CPU 的 使 用 率 上 升 了 十 几 个 百分点 。 按 常理 ， 
这 个 操作 是 不 “正确 ”的 ， 也 是 不 建议 的 ， 但 是 在 这 种 场合 ， 这 个 操作 是 唯一 的 解决 方案 。 

以 我 这 些 年 做 性 能 优化 的 经 验 , 操作 层面 上 的 东西 是 很 简单 的 , 但 是 要 达到 无 招 胜 有 招 的 境 
Fr, 你 必须 十 分 清楚 Oracle 的 基本 原理 , 你 要 明白 每 个 操作 可 能 产生 的 后 果 , 并 且 从 中 排除 主要 
风险 。 有 一 次 我 们 给 客户 做 优化 ， 是 我 们 的 一 个 资深 工程 师 实施 的 , 通过 优化 ， 系 统 响 应 时 间 提 
高 了 10 们 ,CPU 使 用 率 从 100% 下 降 为 50% 左 右 。 后 来 Oracle 公司 的 一 个 朋友 问 我 , 怎么 做 的 ， 
我 说 很 简单 ， 做 表 分 析 ， 要 求 客 户 把 SQL 中 的 提示 全 部 去 掉 就 好 了 。 他 后 来 很 感慨 ， 因 为 这 个 
MH Oracle 公司 也 介入 过 , 但 是 没有 很 好 的 解决 方案 。 他 说 ,做 这 些 操作 很 容易 ,但 是 敢于 做 这 
些 操作 并 且 能 够 肯定 地 知道 做 了 这 些 操作 能 解决 问题 的 人 才 是 真正 的 高 手 。 

确实 是 这 样 , 真正 的 高 手 并 不 是 拥有 一 些 所 谓 的 独门 秘笈 的 人 , 而 是 能 够 做 出 合理 判断 的 人 。 

要 说 明 的 是 ，DB Cache 调整 是 一 个 十 分 复杂 的 问题 。 今 天 给 大 家 介绍 的 是 DB Cache 优化 的 
一 些 原则 ， 并 且 指出 了 DB Cache 优化 时 的 一 些 误区 。 至 于 如 何 分 析 DB Cache 并 做 出 合理 的 设 
置 ， 将 在 今后 的 “优化 小 技巧 ”中 详细 介绍 ， 请 大 家 不 要 着 急 。 
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通过 前 面 的 分 析 ， 我 们 可 以 得 出 如 下 结论 。 

a 如 果 LMT 设 置 为 AUTOALLOCATE 属性 ， 那 么 段 的 默认 扩展 参数 为 64KB ， 当 段 扩展 总 空 
间 超 过 1MB 后 ,按照 IMB 进行 扩展 (推断 : 如 果 段 的 空间 超过 128MB， 则 按照 128MB 
扩展 )。 

a Oracle 数据 库 通过 L3 BMB 来 实现 位 图 管理 。L3 是 最 高 级 的 BMB， 其 次 是 L2，L1 是 最 

底层 的 BMB。 只 有 Ll BMB 包含 块 的 位 图 ， 其 他 级 别 的 BMB 只 保存 下 级 BMB 的 地 址 。 

a L1 BMB 是 成 组 出 现 的 ， 至 少 包 含 一 个 块 ， 每 个 Ll BMB 最 多 包含 64 个 块 的 位 图 。 如 果 
一 个 扩展 超过 64 块 ， 那么 每 组 Ll1 BMB 由 2 个 或 以 上 的 Ll1BMB 组 成 。 每 个 LI BMB 都 
包含 一 个 指向 所 属 的 L2 BMB 的 指针 。 

a L1 BMB 后 面 是 第 一 组 L2 BMB, 每 组 L2 BMB 可 以 包含 1 个 或 多 个 L2 BMB (一 般 情 况 
F, 一 个 L2 BMB 已 经 能 够 存储 所 有 的 LI BMB fi B). 
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O L2 BMB 后 面 是 第 一 组 L3 BMB (在 本 例子 中 ， 由 于 数据 量 不 足 ， 所 以 没有 L3 BMB). 

Q L3 BMB (或 者 L2 BMB) 后 面 是 段 头 信息 (PAGETABLE SEGMENT HEADER)， 段 头 信息 
中 包含 第 一 个 L3 BMB 的 指针 、 高 水 位 信息 〈Highwater) 、 段 扩展 列表 和 L2 BMB 的 地 址 
列表 。 

a 位 图 信息 中 的 取 值 包括 下 面 儿 个 。 
m METADATA; BMB 或 者 段 头 块 。 
m UNFORMATTED; 未 使 用 的 块 。 

FULL; jb, 

m FS4. 填充 率 75% 以 上 的 块 。 

m FS3; 填充 率 5095 一 75% 的 块 。 

m FS2 ， 填充 率 25% ~50% 的 块 。 

m FS1: 填充 率 25% 以 下 的 块 。 











| b 


5 月 27 日 À 无 


淋 


今天 是 三 方 例会 的 日 子 , 由 于 要 讨论 6 H 6 日 实施 的 一 些 细节 ， 所 以 小 齐 也 特意 从 北京 赶 过 
来 。 会 议 的 地 点 也 安排 在 了 浑 南 的 公司 总 部 。 这 种 安排 说 明 今天 会 议 的 规格 很 高 ， 孙 主任 可 能 会 
亲自 参加 今天 的 例会 。 

一 进 会 议 室 发 现 开发 商 的 项 目 总 监 范 总 已 经 先 到 了 , 他 也 是 昨 晚 才 赶 到 沈阳 的 。 我 们 进去 时 
正 坐 在 孙 主 任 旁 边 ， 和 孙 主 任 谈 得 挺 投 机 。 今 天 的 会 议 由 孙 主 任 亲 自主 持 ， 他 首先 阐述 了 6 月 6 
日 进行 第 一 次 实施 的 必要 性 以 及 公司 领导 对 这 次 优化 实施 的 期 望 ， 希 望 我 们 儿 方 能 够 通力 协作 ， 
把 这 次 优化 实施 成 功 地 完成 。 

孙 主 任 讲 完 后 , 小 齐 代表 乙方 谈 了 本 次 优化 实施 的 情况 。 小 齐 讲话 的 前 半 段 强调 了 本 次 优化 
实施 并 不 是 我 们 计划 中 的 ， 存在 较 大 的 风险 。 后 半 段 她 也 代表 优化 实施 方 表态 ,我 们 一 定 会 精心 
准备 ， 认 真实 施 ， 尽 我 们 最 大 的 可 能 创造 一 个 奇迹 。 小 齐 讲话 结束 后 ， 老 于 介绍 了 我 们 针对 6 月 
6 日 的 实施 方案 。 在 实施 方案 介绍 完毕 后 ， 老 于 对 开发 商 提出 了 需要 开发 厂商 配合 的 几 个 方面 。 
O 在 6 日 前 上 线 部 分 已 经 完成 优化 的 SQL， 以 减轻 CPU 的 负担 。 

a 5 日 晚上 完成 一 次 数据 库 全 备份 。 

a 根据 我 们 提交 的 从 未 使 用 的 索引 清单 ， 找 出 确认 未 使 用 的 索引 ， 并 删除 这 些 索引 。 

D 提取 出 一 些 关键 业务 模块 ， 并 在 6 日 前 将 关键 义务 模块 的 主要 性 能 指标 以 及 执行 计划 都 
采集 出 来 ,6 日 优化 实施 完毕 后 ， 对 这 些 模块 进行 测试 ， 并 比 对 性 能 指标 ， 以 便 找到 性 能 
有 所 下 降 的 模块 进行 整改 。 

a 优化 完成 后 ， 对 主要 业务 功能 模块 进行 功能 测试 。 

本 来 不 准备 做 索引 删除 操作 的 ,不 过 我 们 佑 计 开 发 商 肯 定 会 讨价还价 , 所 以 还 是 把 这 一 条 放 
在 里 面 ， 作 为 讨价还价 时 做 出 让 步 的 条 款 。 除 了 这 条 外 ， 其 他 条 款 是 开发 商 必须 做 的 ， 如 果 开 发 
商 拒绝 其 中 的 某 个 条 款 ，6 月 6 日 实施 的 风险 就 会 加 大 。 

范 总 看 样子 准备 得 十 分 充分 。 老 于 刚刚 介绍 完 我 们 的 方案 ， 他 立即 做 出 了 回应 。 

a 由 于 开发 流程 所 限 ，SQL 优化 最 早 能 够 在 6 月 20 日 之 前 提交 成 果 ，6 日 前 没有 一 个 应 用 

可 以 上 线 。 

a 为 了 保证 优化 的 实施 ,5 日 可 以 配合 做 一 个 数据 库 全 备份 , 并且 对 应 用 服务 器 和 数据 库 的 

操作 系统 也 同时 做 一 个 全 备份 。 

a 索引 问题 十 分 复杂 ， 目 前 开发 部 门 正在 审核 。 要 剔除 一 个 索引 的 难度 很 大 ， 必 须 经 过 严 
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格 的 测试 ， 由 于 这 一 点 是 我 们 今天 才 提 出 来 的 ， 所 以 他 还 无 法 做 出 安排 ， 有 具体 时 间 明 天 
可 以 给 我 们 答复 。 

a 关于 关键 业务 模块 ， 因 为 本 系统 中 任何 模块 都 很 关键 ， 如 果 找 出 来 就 很 多 了 ， 并 且 现 场 
的 技术 人 员 能 力 不 足 ， 无 法 对 甚 性 能 指标 做 出 采样 ， 所 以 还 是 希望 我 们 协助 采集 这 些 数 





据 。 

a 关于 功能 测试 ， 由 于 模块 有 几 百 个 ， 人 力 资源 不 足 ， 时 间 上 来 说 也 来 不 及 ， 所 以 只 能 做 
一 些 简单 的 测试 。 

a 另外 要 强调 的 是 ， 由 于 准备 不 足 ， 开 发 商 无 法 对 优化 结果 承担 任何 责任 ， 希 望 优化 小 组 





尽 可 能 完善 优化 方案 ， 以 防备 出 现 性 能 倒退 。 开 发 团队 在 7 日 会 安排 现场 项 目 经 理 小 王 
8 : 00 前 赶 到 现场 ， 协 助 优化 小 组 处 理 可 能 出 现 的 问题 。 

这 应 该 是 最 差 的 结果 了 , 我们 精心 准备 的 一 拳 仿佛 被 一 个 武林 高 手 用 太极 神功 化 解 了 。 开发 
厂商 拒绝 了 所 有 要 求 , 并且 把 他 们 和 这 个 优化 项 目 割裂 开 来 。 从 目前 来 看 ， 在 今天 的 会 议 上 我 们 
几乎 没有 得 到 任何 实质 性 的 东西 。 看 样子 这 次 优化 ,他们 扮演 的 只 是 一 个 看 客 的 角色 。 如 果 我 们 
做 好 了 ， 他 们 也 许 会 上 来 拍 拍 肩膀 说 :“ 兄 弟 ， 你 真 行 ， 干 的 不 错 。 如 果 我 们 干 三 了 ， 那 就 很 难 
说 了 。 范 总 的 讲话 结束 后 ， 大 家 沉默 了 几 分 钟 。 

再 谈 下 去 也 没 多 大 意义 了 , 会 议 刚 刚 开始 不 到 半 个 小 时 ， 孙 主任 就 宣布 散会 ， 同 时 让 我 们 留 
下 来 , 和 张 工 继续 讨论 实施 细 市 。 看 样子 , 孙 主 任 的 情绪 也 不 高 。 我 们 建议 本 次 实施 分 三 天 完成 ， 
每 个 晚上 只 完成 一 套 系 统 。 停机 窗口 从 晚上 8 : 00 到 第 二 天 早晨 7 : 00, 如 果 5 : 00 还 无 法 完成 ， 
就 必须 回 退 。 当 天 晚上 的 统计 作业 延 后 到 第 二 天 中 午 12 : 00 开始 执行 ， 可 能 会 影响 第 二 天 下 午 
的 系统 性 能 , 数据 库 归 档 日 志 的 备份 当天 晚上 以 及 第 二 天 下 午 暂 停 。 第 二 天 早上 我 们 和 客户 各 安 
排 一 个 工程 师 在 现场 值班 ， 其 他 人 上 午休 息 ， 下 午 晚点 过 来 ， 以 便 留 好 体力 干 第 二 天 晚上 的 活 。 

我 们 正和 张 工 讨论 ， 孙 主任 送 走 了 开发 厂商 的 人 ， 又 回 到 会 议 室 说 :“ 我 们 临时 改变 计划 ， 
给 你 们 添 麻 烦 了 。 由 于 准备 比较 仓促 , 这 次 调整 肯定 有 风险 , 做 好 了 大 家 都 好 , 出 了 问题 算 我 的 ， 
大 家 别 有 太 多 的 心理 负担 。” 说 完 向 大 家 摆 摆 手 :“ 我 还 有 个 会 ， 先 走 一 步 。 刚 走 到 门口 ， 孙 主 
任 又 回 过 头 来 说 :“ 不 过 哥 几 个 ， 准 备 尽 可 能 充分 一 些 ， 别 让 我 太 为 难 。 

走出 院子 ， 看 到 有 一 辆 出 租车 正在 下 客 ， 我 连忙 让 老 能 和 老 肖 先 坐 车 回去 ， 我 和 小 齐 、 老 于 
再 等 下 一 辆 。 等 了 5 分钟， 还 是 没 见 空 车 过 来 ， 这 个 时 候 张 工 的 电话 打 过 来 了 ， 小 齐 接 了 电话 后 
十 分 感慨 :“ 刚 才 孙 主任 把 范 总 叫 到 办 公 室 谈 了 半天 ， 和 希望 他 们 能 配合 加 快 应 用 优化 的 进度 ， 配 
合 我 们 6 日 的 优化 操作 。 两 个 人 谈 的 很 诚 县 ,不 仅仅 是 以 工作 关系 谈 的 ， 孙 主任 是 以 朋友 的 身份 
请 范 总 帮忙 。 不 过 范 总 那 边 确实 有 难处 ， 原 本 的 优化 计划 是 20 日 之 前 上 线 , 这 回 要 提前 半 个 月 ， 
他 们 的 人 力 资源 和 技术 能 力 都 有 限 ， 所 以 他 们 不 敢 承 诺 。 为 此 ， 孙 主任 让 张 工 转告 我 们 ， 他 今天 
说 的 话 都 是 发 自 肺 腑 的 ， 大 家 放心 干 ， 只 要 尽力 了 ， 出 了 问题 也 不 怕 。 能 磁 到 这 种 客户 ， 算 是 我 
们 走运 吧 。 

确实 也 是 ， 这 些 年 来 我 见 过 的 客户 起 码 也 上 百 了 ,能 够 这 么 说 这 么 做 的 客户 确实 不 多 。 为 了 
这 样 的 客户 ， 大 家 伙 多 流 点 汗 也 值 啊 。 虽 说 孙 主 任 的 话 让 我 们 很 感动 ， 不 过 感动 过 后 ， 大 家 感到 
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了 更 大 的 压力 。6 日 优化 后 如 果 效 果 不 大 ， 会 让 用 户 对 我 们 的 信心 有 所 下 降 ， 也 会 给 应 用 开发 厂 
商 更 多 打 太 极 拳 的 借口 。 反 过 来 ， 如 果 这 次 优化 的 效果 很 好 ， 那 也 不 是 什么 好 事 。 因 为 一 下 子 优 
化 效果 很 明显 ， 从 表面 上 看 ， 系 统 的 问题 解决 了， 那样 也 可 能 给 开发 商 拒绝 修改 SQL 带 来 借口 。 
所 以 说 这 次 优化 不 仅 要 避免 优化 效果 不 足 导致 系统 性 能 下 降 的 问题 , 也 要 避免 优化 效果 过 好 导致 
开发 商 修改 SQL 的 动力 下 降 的 问题 。 

HEERE, 针对 优化 效果 过 好 的 问题 我 们 展开 了 讨论 。 最 后 的 结论 是 , 重建 索引 的 工作 我 
们 暂时 不 做 。 如 果 7 日 发 现 系 统 性 能 有 所 提升 ， 可 以 达到 我 们 的 目的 ， 那么 这 个 工作 押 后 到 第 二 
次 优化 调整 时 做 ， 如 果 7 日 发 现 系 统 性 能 还 存在 一 定 的 问题 ， 我 们 的 优化 效果 没有 达到 ， 那 么 7 
日 白天 和 晚上 我 们 可 以 陆续 手工 进行 索引 重建 。 由 于 7 日 是 周末 ， 系统 负载 比 平时 小 ， 只 要 我 们 
把 索引 按照 大 小 进行 分 类 ， 白 天 做 小 索引 的 重建 ， 晚 上 做 大 索引 的 重建 ， 应 该 问题 不 大 。 


2 游 今 日 点 评 


























今天 老 白 他 们 和 希望 开发 商 配 合 的 事情 全 部 被 开发 商 否决 了 , 这 种 情况 其 实在 优化 项 目 中 经 党 
碰 到 。 实 际 上 在 这 个 项 目 刚刚 开始 时 ， 老 白 就 已 经 感觉 到 开发 商 可 能 配合 不 力 ， 因此 早 就 做 好 了 
脱离 开发 商 独立 工作 的 准备 。 优 化 项 目 往 往 都 是 上 线 时 间 比 较 长 的 系统 ， 处 于 维护 期 的 中 后 段 ， 
可 能 再 坚持 一 两 年 就 会 退 网 或 者 升级 了 。 对 于 开发 商 来 说 , 这 种 系统 往往 只 留 下 很 小 的 一 支队 伍 
在 对 系统 进行 维护 , 这 支 维护 队伍 往往 只 解决 必须 解决 的 一 些 bug 和 开发 一 些 新 模块 以 满足 客户 
需求 。 在 这 种 系统 中 ,很 多 模块 的 开发 人 员 可 能 都 已 经 离开 了 现场 ， 其 至 离开 了 公司 ， 所 以 对 这 
些 模 块 的 修改 是 开发 人 员 最 不 愿意 面 对 的。 因此 DBA 对 于 开发 人 员 也 要 给 予 足够 的 理解 ， 也 要 
有 充分 的 准备 ， 在 开发 人 员 不 愿意 修改 程序 的 情况 下 ， 拿 出 应 急 方案 来 。 

对 于 一 般 的 项 目 ， 如 果 没 有 开发 商 的 配合 ， 也 可 以 通过 系统 级 的 调整 ， 并 通过 表 分 区 、 索 引 
优化 、 表 碎片 整理 等 方式 达到 优化 的 目的 。 这 种 情况 也 是 老 白 经 常 遇 到 的 。 在 无 法 得 到 开发 商 配 
合 的 情况 下 独立 完成 优化 也 是 DBA 经 常 要 面 对 的 。 而 对 于 沈阳 这 个 项 目 ， 想 要 完全 脱离 开发 商 
的 支持 , 效果 肯定 不 会 很 好 。 因 此 ， 老 白 他 们 面临 在 第 一 次 优化 实施 时 开发 商 完全 不 配合 的 局 面 
时 ， 需 要 更 为 细致 地 准备 优化 方案 。 既 要 在 开发 商 不 能 配合 的 情况 下 ， 尽 可 能 地 提升 系统 性 能 
达到 优化 目的 ， 又 要 控制 好 优化 的 效果 。 所 谓 控 制 好 优化 效果 ， 就 是 第 一 次 优化 不 能 用 光 所 有 的 
手段 ， 对 效果 一 定 要 有 所 保留 ， 以 防 第 一 次 优化 效果 过 好 ， 导 致 开发 商 更 不 愿意 修改 应 用 。 这 种 
优化 项 目 ， 开 发 商 修改 应 用 是 长 期 保持 优化 效果 的 关键 ， 因 此 必须 遥 着 开发 商 修改 应 用 ， 否 则 这 
个 项 目 就 会 前 功 尽 弃 。 


E 信 优 化 小 技巧 ) 临时 表 空 间 和 排序 

临时 表 空 间 和 排序 操作 是 数据 库 中 最 常见 的 操作 ,也 是 绝 大 多 数 DBA 最 为 困惑 的 操作 之 一 。 
本 市 内 容 就 是 要 向 DBA 介绍 临时 表 空 间 以 及 在 临时 表 空间 中 发 生 的 主要 操作 。 本 市 并 不 是 讨论 
临时 段 的 章 证 ， 因 此 需要 了 解 临时 段 的 读者 ， 可 以 参考 本 书 下 一 市 的 相关 内 容 。 本 市 讨论 的 临时 
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段 是 指 在 临时 表 空 间 中 ， 排 序 等 操作 使 用 的 临时 空间 。 

对 于 临时 表 空 间 的 管理 机 制 和 临时 段 的 算法 ，Oracle 7.3 是 一 个 革命 性 的 版 本 。 由 于 Oracle 
7.3 推出 的 OPS 机 制 , 原 有 的 临时 段 算法 无 法 适应 OPS 的 需要 ,所 以 Oracle 公司 推出 了 一 个 全 新 
的 临时 段 管 理 算法 。 在 Oracle7.3 之 前 ， 临 时 段 是 在 需要 时 分 配 ， 使 用 完毕 后 删除 的 。Oracle 7.3 
推出 了 一 种 全 新 的 临时 表 空 间 的 管理 算法 。 新 算法 的 核心 就 是 SEP (SORT EXTENT POOL), 它 
用 来 管理 临时 段 中 扩展 的 结构 ， 存 储 在 共享 地内。 任何 需要 使 用 排序 空间 的 操作 都 需要 从 SEP 
中 分 配 空闲 的 扩展 。 使 用 完毕 后 ， 该 空间 不 需要 释放 ， 只 要 在 SEP 中 将 该 扩展 设置 为 空 亲 即 可 。 

当 数 据 库 实例 启动 后 ，SMON 将 会 进行 一 个 操作 ,删除 该 实例 的 临时 段 ， 并且 对 临时 表 空 间 
进行 碎片 整理 。 在 这 个 操作 完成 前 ， 数 据 库 打开 的 操作 不 能 完成 。 因 此 每 次 数据 库 重启 后 ， 临 时 
段 中 的 垃圾 会 被 完全 清理 。 当 数据 库 打 开 后 , 第 一 个 进行 的 硬盘 排序 的 操作 会 在 相关 的 临时 表 空 
间 内 创建 临时 段 ， 这 个 临时 段 也 是 整个 实例 唯一 的 临时 段 (在 新 的 临时 段 算法 下 ,同一 个 表 空 间 
内 , 每 个 实例 只 有 一 个 临时 段 ) 。 临时 段 中 扩展 的 信息 会 被 记录 在 SEP rh, 硬盘 排序 操作 会 在 SEP 
中 查找 可 用 的 扩展 ， 在 查找 前 ， 需 要 获得 SORT EXTENT POOL 门 锁 。 如 有 果 能 找到 可 用 的 扩展 ， 
那么 SEP 中 被 分 配 的 扩展 将 会 被 标注 为 占用 状态 ， 如 果 找 不 到 可 用 的 扩展 ， 那 么 就 会 试图 从 表 

空间 中 分 配 新 的 空间 ， 如 果 这 个 分 配 工作 因为 表 空 间 的 空闲 空间 不 足 而 无 法 完成 , 那么 会 产生 一 

个 ORA-1652 错误 。 

当 排 序 操 作 完 成 时 ， 会 再 次 获取 SORT EXTENT POOL 门 锁 ， 并 且 将 使 用 的 扩展 标注 为 空闲 ， 
然后 释放 SORT EXTENT POOL 门 锁 。 
新 的 临时 表 空 间 管理 算法 不 需要 频繁 地 分 配 和 释放 临时 段 ， 大 大 提高 了 临时 段 管理 的 效率 。 
由 于 这 种 只 分 配 不 释放 的 算法 ,所 以 DBA 经 常会 看 到 自己 的 临时 表 空 间 总 是 处 于 或 者 接近 100% 
使 用 的 状态 。 其 实 对 于 Oracle7.3 以 后 的 版 本 ,临时 表 空 间 使 用 率 接 近 100948 分 正常 的 。DBA 
可 以 通过 vssort_usage 和 vssort_segments 这 两 个 视图 来 检查 临时 段 的 使 用 情况 
在 RAC/OPS 环境 下 , 临时 段 的 管理 算法 也 是 类 似 的 。 由 于 在 RAC 中 多 个 实例 会 共享 .个 临 
时 表 空 间 ， 所 以 多 个 实例 也 能 够 共享 相同 的 扩展 。 在 RAC 环境 下 ， 每 个 实例 拥有 独立 的 SEP, 
每 个 实例 中 的 排序 操作 需要 在 自己 的 SEP 中 分 配 空间 ,因此 如 果 SEP 中 无 法 分 配 到 足够 的 空间 ， 
就 会 先 在 表 空 间 中 分 配 空间 。 如 果 表 空间 的 空间 已 经 分 配 完毕 ,， 且 别 的 实例 还 有 空闲 的 扩展 , JD 
么 这 个 扩展 可 以 分 配给 需要 的 实例 使 用 ， 这 些 操作 是 不 可 见 的 ， 服 务 器 进程 不 会 收 到 ORA-1652 
的 错误 信息 ， 但 是 在 ALTER LOG 中 会 有 一 个 ORA-1652 的 记录 。 


Pomen undo 表 空 间 和 回 滚 段 


undo/rollback 表 空 间 是 用 于 存放 回 滚 段 (rollback segment) 的 表 空 间 。 回 深 段 是 Oracle 
用 于 保存 被 修改 数据 的 前 映 象 的 数据 空间 。 每 个 回 滚 段 包含 一 些 扩 展 , 而 回 滚 段 采 用 一 种 循环 机 
制 来 使 用 这 些 扩 展 。 当 某 个 扩展 写 满 后 ， 自 动 切换 到 另外 一 个 扩展 继续 使 用 。 一 个 事务 会 将 回 滚 
记录 写 在 回 筷 段 的 当前 位 置 , 并 且 通 过 记录 大 小 来 标明 记录 的 位 置 。 当 前 写 指针 是 回 滚 段 段 头 中 
的 一 个 控制 结构 。 尾 部 指 的 是 回 滚 段 中 最 后 一 条 记录 的 开始 位 置 。 
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回 滚 段 的 数量 和 每 个 回 滚 段 的 大 小 对 于 回 滚 段 的 配置 来 说 至 关 重 要 。 在 OLTP 系统 中 , 设置 
足够 的 回 滚 段 数量 ,以 避免 回 深 段 冲突 。 每 个 回 深 段 的 大 小 应 该 足够 大 ,以 便于 适应 事务 处 理 的 
需要 。Oracle 循环 使 用 回 滚 段 , 所 有 的 在 线 回 深 段 (除了 系统 回 深 段 外 ) 都 会 被 轮流 使 用 。Oracle 
在 使 用 回 滚 段 时 ， 有 以 下 特点 。 

a 一 个 事务 只 使 用 一 个 回 深 段 来 记录 所 有 的 回 滚 记 录 。 

a 多 个 事务 可 以 写 入 相同 的 扩展 。 

a 扩展 被 循环 使 用 ， 任 何 一 个 扩展 都 不 会 被 跳 过 。 

O 如 果 不 能 使 用 下 一 个 扩展 ，Oracle 会 自动 分 配 一 个 新 扩展 ， 并 将 其 插入 这 个 环 中 。 

a Oracle 不 会 使 用 被 尾部 占据 的 扩展 。 

从 上 面 的 原则 可 以 看 出 , 事务 的 持续 时 间 和 事务 的 大 小 同样 是 影响 回 深 段 的 重要 因素 。 一 个 
哪怕 只 使 用 了 一 个 字 节 的 长 时 间 的 事务 也 可 能 导致 回 深 段 扩展 。 如 果 一 个 系统 中 有 多 个 回 深 段 ， 
那么 Oracle 会 根据 下 面 的 原则 来 选择 一 个 回 滚 段 。 

O 首先 ，Oracle 会 选择 当前 事务 数 最 少 的 回 滚 段 。 

a 如 果 有 两 个 以 上 的 回 滚 段 内 当前 有 相同 的 事务 数 ， 那 么 Oracle 会 根据 上 一 个 事务 使 用 的 
I iR BE, 选择 比 这 个 回 滚 段 号 大 的 下 一 个 顺 位 的 回 深 段 。 比如 当前 事务 使 用 了 回 深 7 段 2， 
回 滚 段 1 和 回 滚 段 4 有 最 少 的 事务 数 ， 那 么 Oracle 会 使 用 回 滚 段 4 来 存储 下 一 个 事务 的 
数据 。 

从 上 面 的 原则 ， 我 们 能 够 在 设置 自己 的 回 滚 段 时 得 到 什么 启发 呢 ? AIR PRAY BR BEEK, 
那么 首先 需要 根据 实际 的 事务 大 小 来 确定 回 滚 段 的 存储 参数 , 使 回 深 段 头 不 会 很 快 转 到 段 尾 。 如 
果 回 滚 段 很 快 转 到 尾部 ， 就 会 导致 回 深 段 很 快 进行 扩展 。 第 二 个 应 该 注意 的 问题 是 ， 如 果 执 行 一 
个 长 时 间 运 行 的 查询 , 这 个 查询 访问 的 数据 变化 频率 十 分 快 , 那么 就 需要 保证 回 滚 段 的 大 小 足够 
大 ， 以 保证 你 的 查询 结束 之 前 不 会 出 现 ORA-1555 错误 (Snapshot too old ) 。 

回 深 段 的 大 小 取决 于 数据 库 中 事务 的 特点 。 回 深 段 大 小 的 设计 应 该 满足 数据 库 日 常事 务 的 要 
A, 而 不 是 针对 那些 不 经 常 使 用 的 大 的 事务 。 回 深 段 的 数量 设置 要 保证 不 会 发 生 回 深 段 竞争 。 是 
否 有 回 滚 段 竞争 可 以 通过 v$waitstat 视图 来 查看 ， 代 码 如 下 : 

SELECT CLASS, COUNT FROM v$waitstat WHERE CLASS = '$undot'; 


其 中 任何 非 0 的 Count 值 的 存在 都 说 明 存 在 回 深 段 头 的 竞争 。 
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SALA BBED 的 妙用 


今天 刚 到 办 公 室 , 就 看 见 开发 商 的 项 目 经 理 小 王 焦急 地 在 我 们 的 办 公 室 里 打转 。 AIRE 
进来 了 ， 马 上 满 脸 笑容 地 迎 了 上 来 :“ 白 哥 ， 你 可 来 了 ， 我 这 边 有 个 奇怪 的 问题 请 您 帮 个 忙 。 

“如 果 和 优化 项 目 有 关 的 , 我 肯定 鼎力 相助 ,无 关 的 事情 我 可 帮 不 上 忙 ”, 我 一 副 公事 公办 的 
样子 。 

“ 白 哥 ， 你 这 就 不 够 哥们 了 ， 这 个 项 目 配 上 我 应 该 算 够 意思 吧 ， 今 天 你 帮 我 搞定 这 个 问题 ， 
今后 需要 我 们 配合 的 地 方 我 能 不 向 着 你 吗 ?” 
我 看 着 小 王 急 得 抓 耳 搁 腮 的 ， 知 道 也 去 得 差不多 了 ， 就 说 :“ 兄 弟 ， 这 可 是 你 说 的 ， 千 万 别 
食 言 啊 。” 

原来 小 王 他 们 负责 的 一 个 项 目 , 今天 要 完成 项 目的 交付 前 测试 ， 明 天 提交 测试 版 本 。 但 是 在 
他 们 测试 环境 上 要 创建 几 张 新 表 时 总 是 报错 , 使 他 们 今天 的 测试 无 法 正常 进行 。 我 检查 了 一 下 系 
统 ， 发 现 系 统 的 工作 基本 正常 ， 数 据 库 的 读 写 都 没什么 问题 ， 不 过 当 他 们 用 imp 导入 测试 数据 
时 ， 突 然 开始 报 ORA-8102， 无 法 导入 数据 。 

我 和 小 王 到 了 他 们 的 办 公 室 , 让 他 们 演示 了 一 下 导入 过 程 ， 导入 第 一 张 表 时 没有 报错 ,而 导 
入 第 二 张 表 时 就 出 现 了 ORA-8102， 检 查 Trace 文件 ， 发 现 : 


*** 2006=05=28 08:59:02.369 
*** ACTION NAME:() 2006-05-28 08:59:02.369 
*** MODULE NAME: (SQL*Plus) 2006-05-28 08:59:02.369 
*** SERVICE NAME: (SYSSUSERS) 2006-05-28 08:59:02.369 
*** SESSION ID:(150.11795) 2006-05-28 08:59:02.369 
oer 8102.2 - obj# 49, rdba: 0x0200557a(afn 8, blk# 21882) 
kdk key 8102.2: 
ncol: 1, len: 5 
key: (5): 04 c3 45 41 64 


我 发 现 ORA-8102 是 在 创建 表 时 出 现 , 为 了 找到 imp 操作 中 出 错 的 部 分 , 我 们 需要 取出 刚才 
报错 的 那 张 表 的 建 表 脚本 。 可 以 通过 下 面 的 方法 获得 该 建 表 脚本 : 

imp show=y full=y >impdata.log 

这 样 imp 操作 就 把 所 有 的 建 表 脚本 都 写 入 impdatalog 了 。 打 开 impdatalog， 取 出 第 二 个 表 
的 建 表 语 句 ， 直 接 在 SQL*Plus 上 执行 ， 报 相同 的 错误 ， 看 样子 确实 是 在 建 表 时 出 错 了 。 从 日 志 
上 看 ， 出 错 的 对 象 的 对 象 号 (obj#) 是 49。 我 们 需要 知道 49 号 对 象 是 什么 ， 于 是 执行 下 面 的 语 
fi): 





























5H28H BBED 的 妙用 111 





SQL> SELECT name,type# FROM obj$ WHERE obj#=49; 
NAME TYPE# 


其 中 工 CON2 是 一 个 索引 ， 我 们 检查 一 下 这 个 索引 是 属于 哪 张 表 的 具体 代码 如 下 : 


SQL> SELECT table name FROM dba indexes WHERE index name-'I CON2'; 
TABLE NAME 


其 中 con$ 表 是 一 个 系统 表 ， 存 放 约束 关系 数据 。 在 SQL*Plus 上 通过 10046 的 Trace 文件 来 确认 
=f; 
SQL>ALTER SESSION SET EVENTS='10046 immediate trace context forever,level 10'; 


然后 再 执行 那个 建 表 脚本 ， 在 产生 的 日 志文 件 里 ， 我 们 发 现 如 下 信息 : 








PARSING IN CURSOR #3 len=51 dep-1 uid=0 oct=6 lid=0 tim=839547263840 hv=2404924642 
ad='cef1d768' 
update con$ set con#=:3 where owner#=:1 and name=:2 
END OF STMT 
PARSE #3:c=0,e=386,p=0,cr=0,cu=0,mis=1, r=0, dep=1, o0g=4, tim=839547263834 
BINDS #3: 
kkscoacd 
Bind#0 
oacdty=02 mx1-22(22) mxlc=00 mal=00 scl=00 pre=00 
oacflg=08 £12=0001 frm=00 csi=00 siz=24 off=0 
kxsbbbfp=800003ffbfdeac50 bln=24 avl=03 flg=05 
value=686500 
Bind#1 
oacdty=02 mx1-22(22) mxlc=00 mal=00 scl=00 pre=00 
oacflg=08 £12=0001 frm=00 csi=00 siz=24 off=0 
kxsbbbfp-800003ffbfdeac80 bln=22 avl=01 flg=05 
value=0 
Bind#2 
oacdty=01 mx1-32(16) mxlc=00 mal=00 scl=00 pre=00 
oacflgs18 £12=0001 frm=01 csi=871 siz=32 of f=0 
kxsbbbfp=c0000000cefled2e bln=32 avl=16 flg=09 
value="_NEXT_CONSTRAINT" 
oer 8102.2 - obj# 49, rdba: 0x0200557a(afn 8, blk# 21882) 
kdk key 8102.2: 
ncol: 1, len: 5 





key: (5): 04 c3 45 41 64 
从 日 志 上 看 ， 是 在 做 修改 congs 表 时 出 的 错 。 从 后 面 的 绑 定 变量 列表 里 看 ， — dees 
量 。 第 一 个 绑 定 变 量 是 给 con# 赋 值 的 ， 从 Binato 来 看 ， 这 个 值 是 686500。 第 二 个 绑 定 


是 owner# 的 WHERE 条 件 ， 值 是 0, o TKS « 2 G name 的 取 值 ， 

我 们 可 以 看 到 正好 是 _NEXT_CONSTRAINT。 这 个 SQL HJ V. Jf NEXT. CONSTRAINT 对 应 的 
con# 值 设置 为 686500。 这 个 语句 是 oe a 根据 生成 约束 关系 记录 
的 算法 ,首先 从 congs 表 中 找到 NAME=_NEXT_CONSTRAINT 的 记录 ,作为 新 产生 的 CONSTRAINT 
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的 主键 con# 的 取 值 ， 再 修改 cons 表 ， 将 _NEXT_CONSTRRAINT 的 con# 加 1, 

通过 跟踪 我 们 可 以 看 到 , UPDATE 的 con# 参 数 是 686500, 那么 修改 前 这 个 值 是 686499, 翻 
译 成 Oracle 内 部 存储 格式 就 是 c3 45 41 64 (数值 类 型 的 值 转换 为 Oracle 内 部 存储 格式 的 算法 
请 参考 今天 的 “优化 小 技巧 ”)。 这 就 是 从 Trace 中 看 到 的 出 现 oer 8102 的 那个 key。 根 据 Trace 
信息 可 以 看 到 *qba:0x0200557(8/21882) 是 一 个 时 节点 块 : 


Block header dump:  0x0200557a 
Object id on Block? Y 
seg/obj: 0x31 csc: 0x00.23049f4 itc: 5 flg: 0 typ: 2 - INDEX 
fsl: 0 fnx: 0x200557b ver: 0x01 


该 块 属于 0x31 对 象 ， 也 就 是 obj#=49 MX (r CON2), TYP:2-INDEX 说 明 这 个 块 是 索 
引 块 。 从 块头 来 看 ， 块 并 无 异常 。 该 块 拥 有 193 条 记录 (在 索引 块 的 转 储 文件 中 ，kqxconro 对 
应 的 值 就 是 本 块 中 的 记录 数 ， 本 案例 是 193), ， 每 条 记录 对 应 一 条 con$ 表 的 记录 ， 如 下 : 



































col 0; len 4; (4): c3 45 3f 21 
row#185[5374] flag: ---D--, lock: 3, len=13, data:(6): 02 00 69 21 00 44 
col 0; len 4; (4): c3 45 3f 22 
row#186[5361] flag: ---D--, lock: 3, len=13, data:(6): 02 00 69 21 00 43 
col 0; len 4; (4): c3 45 3f 23 
row#187[5348] flag: ---D--, lock: 3, len=13, data:(6): 02 00 69 21 00 41 
col 0; len 4; (4): c3 45 3f 24 
row#188[5335] flag: ------ , lock: 0, len=13, data:(6): 02 00 69 21 00 23 
col 0; len 4; (4): c3 45 41 5b 
row#189[5322] flag: ------ , lock: 0, len=13, data:(6): 02 00 69 21 00 1f 
col 0; len 4; (4): c3 45 41 5c 
row#190[5309] flag: ------ , lock: 0, len=13, data:(6): 02 00 69 21 00 le 
col 0; len 4; (4): c3 45 41 5d 
row#191[5296] flag: ------ , lock: 0, len=13, data:(6): 02 00 69 21 00 22 
col 0; len 4; (4): c3 45 41 5e 
row#192[5166] flag: ------ , lock: 0, len=13, data:(6): 00 40 00 aa 00 11 
col 0; len 4; (4): c3 45 42 0e 











JR. NEXT CONSTRAINT 应 该 在 con$ 表 刚刚 建立 时 就 已 经 产生 ， 因 此 该 记录 应 该 位 于 
1 号 文件 。 从 这 193 条 记录 来 看 ， 只 有 最 后 一 条 记录 0x004000aa00-11 (1/43520 第 11 号 记录 ) 
位 于 FILE 1。 由 于 _NEXT_CONSTRAINT 的 con# 是 下 一 条 con$ 记 录 的 con# 的 值 ， 所 以 该 记录 应 
该 是 该 表 中 的 con# 最 大 的 记录 ， 理 应 处 于 索引 的 最 后 一 行 。 而 从 该 行 的 值 来 看 c3 45 42 0e, 
翻译 成 十 进 制 值 应 该 是 686514， 这 个 值 明显 和 686499 不 同 。 这 就 是 导致 ORA-8102 的 主要 原 
因 。 














看 样子 问题 就 出 在 索引 上 的 键 值 和 表 上 的 键 值 不 同上 了 了。 由 于 这 张 表 上 出 现 的 这 个 故障 , 创 
建 带 约束 关系 的 表 就 会 出 错 , 而 创建 普通 表 就 没有 问题 所 以 第 一 张 不 带 约束 关系 的 表 能 够 创建 
成 功 , 而 第 二 张 带 约束 关系 的 表 就 无 法 成 功 创建 了 。 我 想 如 果 只 是 索引 损坏 那 还 好 办 ， 直 接 重 建 
一 下 就 行 了 ， 如 下 : 


SQL> ALTER index i con2 rebuild; 
ALTER index i, con2 rebuild 


* 
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ERROR at line 1: 
ORA-00701: object necessary for warmstarting database cannot be altered 


看 到 报错 我 才 想 起 来 ，i_con2 是 一 个 bootstrap$ 对 象 (关于 bootstrap$ 对 象 , 请 参考 今 
天 的 今日 点 评 ), 而 且 obj# 小 于 51, 不 仅仅 是 bootstrap$ 对 象 , 而 且 是 核心 hootstrap$ 对 象 ， 
连 38003 事件 都 不 会 起 作用 。 

我 告诉 小 王 ， 由 于 cons$ 表 上 的 索引 故障 ， 所 以 无 法 创建 新 的 带 约束 关系 的 表 了 。 建 议 他 们 
把 数据 库 重 建 一 下 , 再 重新 导入 一 下 数据 就 没 问 题 了 。 目 前 只 是 无 法 创建 新 的 约束 关系 ,其 他 操 
作 不 会 受到 影响 。 

小 王 很 着 急 地 问 ， 还 有 没有 其 他 办 法 。 实 际 上 他 们 今天 只 需要 导入 10 多 张 表 的 数据 ， 其 他 
数据 是 已 经 准备 好 的 。 如 果 重 建 数据 库 ， 那 么 前 一 阵子 他 们 准备 好 的 800 GB 数据 就 需要 重新 导 
出 再 导入 进去 。 在 这 台 P650 上 ， 做 这 个 事情 起 码 要 折腾 一 整 天 。 而 且 要 导出 800GB 的 数据 ， 现 
在 测试 机 上 的 磁盘 空间 都 不 够 。 

这 就 难 办 了 ， 如 果 不 重建 数据 库 , 索引 又 不 能 重建 , 还 能 有 什么 办 法 呢 ?” 看 样子 唯一 的 办 法 
就 是 使 用 BBED 了 。 通 过 BBED 将 索引 和 表 的 键 值 修改 为 一 致 的 就 可 以 解决 问题 了 。BBED 是 
Oracle 的 数据 块 修复 工具 ， 可 以 用 来 对 数据 块 进行 分 析 和 修改 。 由 于 该 工具 直接 修改 数据 块 的 内 
容 ， 所 以 在 生产 环境 中 是 不 敢 轻 易 使 用 的 。 我 做 DBA 这 么 多 年 以 来 ， 用 BBED 解决 问题 也 只 
容 寥 可 数 的 几 次 。 今 天 这 个 库 是 个 测试 库 ， 风 险 不 大 ， 拿 来 练 练 手 还 是 不 错 的 。 

经 过 考虑 , 我 决定 通过 修改 索引 上 的 数据 ,使 素 引 和 表 一 致 。 这 条 记录 的 位 置 是 在 数据 块 中 
偏 移 量 5166 开始 的 位 置 (5166 是 一 个 相对 偏 移 量 。 实 际 上 通过 5166 这 个 值 ， 可 以 计算 出 这 条 
记录 在 块 中 的 绝对 位 置 。 计 算 绝 对 位 置 的 方法 参考 今日 的 “优化 小 技巧 ”)。 在 这 一 行 数据 中 ,第 
一 个 字段 是 ROWID, JE 6 个 字 节 ， 从 第 7 个 字 节 开始 就 是 这 条 索引 的 键 值 。 从 Trace 中 我 们 看 到 
的 键 值 是 c3 45 42 0e， 我 们 要 把 键 值 修改 为 c3 45 41 64， 也 就 是 说 要 把 5174-5175 FHH 
两 个 值 从 42 0E 修改 为 41 64。 确 认 计算 的 偏 移 量 没 有 错误 后 ， 我 使 用 BBED 修改 了 数据 ， 然 
后 重启 数据 库 ， 再 执行 建 表 脚 本 ， 问 题 消失 了 。 

小 王 看 着 我 眼花 综 乱 的 操作 ， 在 旁边 眼 都 直 了 。 他 说 :“ 白 哥 ， 学 你 这 个 难 不 ? 要 不 你 教 我 
算 了 ， 有 这 个 手艺 ， 今 后 混 口 饭 吃 就 不 悉 了 。” 

我 说 :“ 你 小 子 还 是 先 帮 有 我 们 尽快 把 几 个 SQL 修改 好 吧 。 如 果 你 小 子 不 卖力 气 ， 别 怪我 不 客 


E 
“No 
` 



































oM 今日 点 评 

今天 老 白 帮助 小 王 他 们 解决 了 一 个 问题 。 在 做 优化 项 目 时 ， 帮 助 开 发 团队 解决 一 些 和 项 目 
无 关 的 问题 ， 对 DBA 来 说 一 般 是 稍 带 手 的 事情 。 而 这 对 于 改善 优化 团队 和 开发 团队 的 关系 很 
有 用 ， 如 果 碰 到 这 种 机 会 一 般 来 说 一 定 要 抓 住 。 今 天 小 王 欠 了 老 白 一 个 人 情 ， 在 后 面 的 优化 实 
施 过 程 中 ， 小 王 和 老 白 的 配合 就 更 容易 了 。 
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今天 老 白 通过 了 一 个 非常 规 的 手段 ， 通 过 BBED 修改 数据 解决 了 问题 。 使 用 BBED 修改 生 
产 库 是 一 件 十 分 谨慎 的 事情 ,一定 要 有 足够 的 把 握 才 可 以 实施 。 由 于 今天 是 在 一 个 测试 环境 中 ， 
所 以 老 白 今天 就 没有 采取 备份 等 手段 。 如果 在 生产 环境 中 , 一 定 要 首先 备份 要 修改 的 数据 文件 才 
能 实施 操作 。 

今天 碰 到 的 新 概念 还 是 很 多 的 ， 比 如 说 bootstrap$ 对 象 的 概念 。 大 家 可 能 对 bootstrap$ 
对 象 十 分 陌生 ， 其 实 搞 过 软件 开发 的 人 都 知道 ， 一 个 系统 在 刚刚 开始 时 要 对 系统 进行 初始 化 , BL 
括 初 始 化 缓冲 区 、 变 量 、 常 量 等 ， 这 个 过 程 就 是 bootstrap 过 程 。Oracle 也 有 一 个 bootstrap 
过 程 ， 就 是 对 Oracle 数据 库 进行 初始 化 。 和 初始 化 过 程 相关 的 对 象 我 们 称 为 bootstrap 对 象 。 
这 些 对 象 的 创建 脚本 都 存放 在 bootstrap$ 表 中 。 这 些 对 象 是 不 能 随便 重建 的 ， 哪 怕 是 索引 也 不 
能 随便 重建 。bootstrap 对 象 分 为 核心 bootstrap 对 象 和 非 核心 bootstrap 对 象 。 如 果 非 核 
心 bootstrap 对 象 出 了 问题 ， 可 以 通过 设置 EVENT 38003 (关于 EVENT 38003 的 详细 情况 ， 
请 参考 Metalink Note 279797.1), 使 系统 启动 时 不 把 这 些 对 象 作为 bootstrap Rib. mA 
事件 对 于 核心 bootstrap$ 对 象 是 不 起 作用 的 。 


F Sme) 如 何 启用 BBED 


BBED 是 Oracle 修改 数据 块 的 一 个 常用 工具 ， 从 Oracle 7.3.2 就 可 以 提供 了 ， 用 来 对 那些 损 
坏 的 数据 库 进 行 修复 。BBED A CLARE Oracle 安装 介质 安装 了 ， 只 是 在 一 般 环境 下 没有 启用 。 
在 Windows F, BBED 一 般 在 SORACLE_HOME/bin 目录 下 。 在 Unix F, BBED 默认 情况 下 并 没 
有 安装 ， 不 过 在 Unix 平台 下 ， 可 以 使 用 以 下 命令 产生 


cd SORACLE HOME/rdbms/lib 
make -f ins rdbms.mk SORACLE_HOME/rdbms/1lib/bbed 


或 者 
cd SORACLE_HOME/bin 
make -f ins rdbms.mk BBED-SORACLE HOME/bin/bbed S$ORACLE HOME/bin/bbed 


BBED 命令 可 以 使 用 HELP=Y 来 查看 帮助 ， 具 体 如 下 : 


BBED HELP=Y 

PASSWORD - Required parameter 

FILENAME - Database file name 

BLOCKSIZE - Database block size 

LISTFILE - List file name 

MODE - [browse/edit] 

SPOOL - Spool to logfile [no/yes] 

CMDFILE - BBED command file name 

LOGFILE - BBED log file name 

PARFILE - Parameter file name 

BIFILE - BBED before-image file name 
REVERT - Rollback changes from BIFILE [no/yes] 
SILENT - Hide banner [no/yes] 

HELP - Show all valid parameters [no/yes] 


PASSWORD 参数 是 BBED 工具 的 保护 参数 。 启 动 BBED 工具 是 需要 口令 的 , 这 是 Oracle 公司 
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的 一 个 保护 措施 ， 不 希望 BBED 被 非 授权 使 用 。 不 过 Oracle 公司 针对 BBED 的 口令 已 经 是 一 个 
公开 的 密码 了 ， 在 所 有 的 BBED 版 本 中 ， 口 令 都 是 blockedit。 

FILENAME 是 BBED 需要 处 理 的 Oracle 文件 名 。 如 果 处 理 单个 文件 ， 可 以 使 用 这 个 参数 ;如 
果 要 处 理 多 个 文件 ， 建 议 使 用 LISTFILE 来 代替 这 个 参数 。LISTFILE 对 应 的 是 一 个 文件 名 ， 比 
#H LISTFILE-mydbfile.txt, mydbfile.txt 的 内 容 如 下 : 








: \ORACLE\O 
: \ORACLE\O 
: \ORACLE\O 
: \ORACLE\O 
RACLE\O 
: \ORACLE\O 
: \ORACLE\O 
: \ORACLE\O 
: \ORACLE\O 


该 文件 名 的 格式 是 文件 ID 加 上 文件 名 。 

MODE 有 两 个 取 值 : 一 个 是 browse, 也 就 是 仅仅 浏览 数据 , 不 做 修改 ; 另外 一 个 取 值 是 edit, 
就 是 要 修改 数据 。 如 果 你 用 BBED 的 目的 是 修改 数据 ， 那 么 一 定 要 选择 MODE- edit, 

BLOCKSIZE 是 数据 文件 的 块 大 小 。 

SPOOL=yes |no 的 含义 是 是 否 要 把 操作 过 程 写 入 日 志 。BBED 操作 是 十 分 重要 的 操作 ， 因 此 
建议 大 家 使 用 SPOOL=yes。 

CMDFILE=< 茶 个 文件 名 >， 启 动 BBED 后 直接 执行 的 脚本 ， 里 面 可 以 包含 BBED 命令 。 

LOGFILE=< 某 个 文件 名 >， 日 志文 件 的 名 字 。 

PRREFILE=< 某 个 文件 名 >， 参 数 文件 的 名 字 。 如 果 你 有 很 多 参数 ， 写 成 命令 行 不 方便 ， 可 以 
编辑 一 个 参数 文件 。 
BIFILE=< 某 个 文件 名 >， 修 改 数据 块 前 可 以 将 修改 前 映像 保存 在 一 个 文件 里 ， 以 便于 出 问题 
后 使 用 BIFILE 的 内 容 进 行 恢复 。 

REVERT-yes |no 表示 是 否 可 以 使 用 BIFILE 进行 回 退 。 

SILENT=yes |no 表示 是 否 可 以 使 用 静默 模式 。 静 默 模式 适合 于 使 用 CMDFILE 的 批 处 理 方式 。 

上 面 我 们 介绍 了 BBED 的 启动 参数 ,下 面 我 们 通过 一 个 小 案例 来 学 习 如 何 使 用 BBED。 我 们 
设计 的 场景 是 如 果 在 系统 数据 文件 中 发 现 一 个 数据 块 的 事务 状态 一 直 没 有 提交 , 则 使 用 BBED 来 
修改 数据 块 中 的 事务 状态 。 


BBED LISTFILE-listfile.txt BLOCKSIZE-16384 


DATANORA92NSYSTEMO1.DBF 
ATANORA92NUNDOTBSO1.DBF 
DATANORA92NDRSYSO1.DBF 
DATANORA92NEXAMPLEO1.DBF 
DATANORA92NINDXO1.DBF 
DATANORA92NODMO1 .DBF 
ATANORA92NTOOLSO1.DBF 
DATANORA92NUSERSO1.DBF 
DATANORA92NXDBO1.DBF 


oO 


oO 
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多 多 名 多 多 名 多 多 多 









































口令 : 
输入 blockedit 
BBED: Release 2.0.0.0.0 - Limited Production on 星期 二 4 H 15 02:04:35 2008 














Copyright (c) 1982, 2002, Oracle Corporation. All rights reserved. 
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修改 文件 中 的 第 62 个 数据 块 





BBED> set block 62; 
BLOCK# 62 


BBED> p ktbbh 
struct ktbbh, 72 bytes 
ubi ktbbhtyp 
union ktbbhsid, 4 bytes 
ub4 ktbbhsg1 
ub4 ktbbhod1 
struct ktbbhcsc, 8 bytes 
ub4 kscnbas 
ub2 kscnwrp 
b2 ktbbhict 
ubl ktbbhflg 
ubl ktbbhfsl 
ub4 ktbbhfnx 
struct ktbbhitl[0], 24 bytes 


struct 
ub2 
ub2 
ub4 
struct 
ub4 
ub2 
ubl 


ktbitxid, 8 bytes 
kxidusn 
kxidslt 
kxidsqn 
ktbituba, 8 bytes 
kubadba 
kubaseq 
kubarec 


ub2 ktbitflg 


union _ 


ktbitun, 2 bytes 


b2 ktbitfsc 
ub2  ktbitwrp 
ub4 ktbitbas 


struct ktbbhitl[1], 24 bytes 


struct 
ub2 
ub2 
ub4 
struct 
ub4 
ub2 
ubl 


ktbitxid, 8 bytes 
kxidusn 
kxidslt 
kxidsqn 
ktbituba, 8 bytes 
kubadba 
kubaseq 
kubarec 


ub2 ktbitflg 


union _ 


ktbitun, 2 bytes 


b2 _ktbitfsc 
ub2  ktbitwrp 
ub4 ktbitbas 


使 用 map 命令 查看 当前 数据 块 
BBED> map 





File: C:\oracle\ora92\datadb\SYSTEM01.DBF 


Block: 62 


KTB Data Block (Table/Cluster) 


@20 
@20 
@24 
@24 
@24 
@28 
@28 
@32 
@36 
@38 
@39 
@40 
@44 
@44 
@44 
@46 
@48 
@52 
@52 
@56 
@58 
@60 
@62 
@62 
@62 
@64 
@68 
@68 
@68 
@70 
@72 
@76 
@76 
@80 
@82 
@84 
@86 
@86 
@86 
@88 


(0) 


0x01 (KDDBTDATA) 


0x00000012 
0x00000012 


0xf72537a2 
0x0009 

2 

0x02 (NONE) 
0x00 
0x00000000 


0x0006 
0x0006 
0x004af52e 


0x0080039c 
0xe891 

0x01 

0x2001 (KTBFUPB) 


0 
0x0000 
0xf72537a5 


0x0008 
0x0044 
0x004a0e5e 


0x0080011d 
0xf935 

0x01 

0x8000 (KTBFCOM) 


9 
0x0009 
Oxf7251d0b 


Dba:0x00000000 
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struct kcbh, 20 bytes 


struct 


struct 


struct 


ktbbh, 72 bytes 


kdbh, 14 bytes 


kdbt[1], 4 bytes 


sb2 kdbr[210] 


ubi freespace[841] 


ubl ro 


wdata[15009] 


ub4 tailchk 


BBED> p kcbh 
kcbh, 20 bytes 


struct 
ubi 
ubl 
ubi 
ub1 
ub4 
ub4 
ub2 
ub1 
ubi 
ub2 
ub2 





type kcbh 
frmt kcbh 
sparel_kcbh 
spare2_kcbh 
rdba_kcbh 
bas_kcbh 
wrp_kcbh 
seq_kcbh 
flg_kcbh 
chkval_kcbh 
spare3_kcbh 


BBED> map /v 


File: 
Block: 


C:\oracle\ora92\datadb\SYSTEM01.DBF 


62 


(0 


@0 

@20 

@92 

@106 

@110 

@530 

@1371 

@16380 

@0 

@0 0x06 

@1 0x02 

@2 0x00 

@3 0x00 

@4 0x0040003e 
@8 0xf72537a5 
812 0x0009 

@14 0x01 

@15 0x06 (KCBHFDLC, KCBHFCKV) 
@16 0x3b24 

@18 0x0000 





Dba: 0x00000000 


KTB Da 


struct 
ubl 
ubi 
ubi 
ubi 
ub4 
ub4 
ub2 
ubl 
ubi 
ub2 
ub2 





struct 
ubi 
uni 


ta Block (Table/Cluster) 


kcbh, 20 bytes 


type kcbh 
frmt kcbh 
sparel_kcbh 
spare2_kcbh 
rdba_kcbh 
bas_kcbh 
wrp_kcbh 
seq_kcbh 
flg_kcbh 
chkval_kcbh 
spare3_kcbh 


ktbbh, 72 bytes 


ktbbhtyp 
on ktbbhsid, 


4 bytes 





oo OU FN 


@20 
@20 
@24 
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struct ktbbhcsc, 8 bytes 028 
b2 ktbbhict 036 
ubl ktbbhflg 038 
ubi ktbbhfsl 039 
ub4 ktbbhfnx @40 
struct ktbbhitl[2], 48 bytes @44 
struct kdbh, 14 bytes @92 
ubl kdbhflag @92 
bl kdbhntab @93 
b2 kdbhnrow @94 
sb2 kdbhfrre @96 
sb2 kdbhfsbo @98 
sb2 kdbhfseo @100 
b2 kdbhavsp @102 
b2 kdbhtosp @104 
struct kdbt[1], 4 bytes @106 
b2 kdbtoffs @106 
b2 kdbtnrow @108 
sb2 kdbr[210] @110 
ubl freespace[841] 0530 
ubl rowdata[15009] 01371 
ub4 tailchk 016380 
BBED> map 
File: C:\oracle\ora92\datadb\SYSTEM01.DBF (0) 
Block: 62 Dba: 0x00000000 


KTB Data Block (Table/Cluster) 


struct kcbh, 20 bytes @0 
struct ktbbh, 72 bytes @20 
struct kdbh, 14 bytes @92 
struct kdbt[1], 4 bytes 0106 
sb2 kdbr[210] 0110 
ubl freespace[841] 0530 
ubl rowdata[15009] 01371 
ub4 tailchk 016380 


BBED> p ktbbh 
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struct ktbbh, 72 bytes 020 
ubi ktbbhtyp @20 0x01 (KDDBTDATA) 
union ktbbhsid, 4 bytes 024 
ub4 ktbbhsg1 @24 0x00000012 
ub4 ktbbhod1 @24 0x00000012 
struct ktbbhcsc, 8 bytes @28 
ub4 kscnbas @28 0xf72537a2 
ub2 kscnwrp @32 0x0009 
b2 ktbbhict @36 2 
ubl ktbbhflg 038 0x02 (NONE) 
ubl ktbbhfsl @39 0x00 
ub4 ktbbhfnx @40 0x00000000 
struct ktbbhitl[0], 24 bytes @44 
struct ktbitxid, 8 bytes @44 
ub2 kxidusn @44 0x0006 
ub2 kxidslt @46 0x0006 
ub4 kxidsqn @48 0x004af52e 
struct ktbituba, 8 bytes 052 
ub4 kubadba @52 0x0080039c 
ub2 kubaseq @56 0xe891 
ubl kubarec @58 0x01 
ub2 ktbitflg @60 0x2001 (KTBFUPB) 
union _ktbitun, 2 bytes @62 
b2 _ktbitfsc @62 0 
ub2 _ktbitwrp @62 0x0000 
ub4 ktbitbas @64 0xf72537a5 
struct ktbbhitl[1], 24 bytes @68 
struct ktbitxid, 8 bytes @68 
ub2 kxidusn @68 0x0008 
ub2 kxidslt @70 0x0044 
ub4 kxidsqn @72 0x004a0e5e 
struct ktbituba, 8 bytes 076 
ub4 kubadba @76 0x0080011d 
ub2 kubaseq @80 0xf935 
ubl kubarec @82 0x01 
ub2 ktbitflg @84 0x8000 (KTBFCOM) 
union _ktbitun, 2 bytes @86 
b2 _ktbitfsc @86 9 
ub2 _ktbitwrp @86 0x0009 
ub4 ktbitbas @88 0xf7251d0b 


BBED» p ktbbh.ktbbhitl[0].ktbitflg 
ub2 ktbitflg @60 


从 上 面 可 以 看 到 ，ktbbh itl1[0] 对 应 的 事务 状态 当前 是 0x2001 (KTBFUPB), ， 说 明 此 事务 
一 直 没 有 提交 ， 状 态 不 对 ， 需 要 修改 ， 代 码 如 下 : 


BBED> modify /x 0x8000 ktbbh.ktbbhitl[0].ktbitflg 

File: C:\oracle\ora92\datadb\SYSTEM01.DBF (0) 

Block: 62 Offsets: 60 to 571 Dba:0x00000000 
80000000 a53725£7 08004400 5e0e4a00 1d018000 35£90100 00800900 O0b1d25£7 
0001d200 ffffb601 ff047f£06 7£060000 d2005£3f 173fdb3e 9a3e5a3e 1a3eda3d 


0x2001 (KTBFUPB) 
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993d583d 183dd73c 
950395839 1739da38 
8e354635 0a35bc34 
8a314b31 0831c530 
7e2d3d2d fd2cbd2c 
52290d29 cd288d28 
fe24b524 73243124 
a5205e20 1820d21f 
321ce81b a21b5d1b 
e7179b17 50170117 
6c132913 eal2ab12 
f30ea80e 620e180e 
010ac309 7e093809 
00000000 00000000 


«32 bytes per line 


9b3c5c3c 
99385d38 
70344034 
89304d30 
812c432c 
4d280d28 
eb23a523 
901f4c1f£ 
151bd01a 
c4168216 
68122612 
d30d8a0d 
f608b508 
00000000 


> 


1d3cdd3b 
1d38e137 
0334c233 
1030cd2f 
022cbc2b 
cd278c27 
5£231923 
051fbcle 
8bla4ala 
4016fb15 
d1117Db11 
440dfa0c 
74083308 
00000000 


BBED» p ktbbh.ktbbhitl[0].ktbitflg 


ub2 ktbitflg 


BBED» undo 


BBED> modify /x 0120 filename 


fset 60. 


File: C:\oracle\ora92\datadb\SYSTEM01.DBF 
60 to 


Block: 62 


01200000 a53725£7 
00018200 ffffb601 
993d583d 183dd73c 
950395839 1739da38 
8e354635 0a35bc34 
8a314b31 0831c530 
7e2d3d2d fd2cbd2c 
52290d29 cd288d28 
fe24b524 73243124 
a5205e20 1820d21f 
321ce81b a21Db5d1b 
e7179b17 50170117 
6c132913 eal2ab12 
f30ea80e 620e180e 
010ac309 7e093809 
00000000 00000000 


«32 bytes per line 


使 用 undo 命令 以 后 ， 


Offsets: 


08004400 
ff047f06 
953c5c3c 
99385d38 
70344034 
89304d30 
812c432c 
4343280428 
eb23a523 
901f4c1f 
151bd01a 
c4168216 
68122612 
d30d8a0d 
f608b508 
00000000 


> 


5e0e4a00 
7f060000 
1d3cdd3b 
1d38e137 
0334c233 
1030cd2f 
022cbc2b 
cd278c27 
5£231923 
051fbcle 
8bla4ala 
4016fb15 
d1117b11 
440dfa0c 
74083308 
00000000 


al3b643b 
a0375937 
81334133 
8c2f£472£f 
6c2b1c2b 
49270a27 
d7229422 
731e2ele 
0alac619 
02156115 
3511ef10 
b40c6a0c 
ef07ac07 
00000000 


233be33a 
££04d536 
ff32bf32 
022£c62e 
dc2a992a 
ce269126 
52220a22 
e81da21d 
86194619 
1e15d714 
b0105b10 
270ce00b 
69070000 
00000000 


@60 


修改 完成 后 ， 如 果 发 现 有 错误 ， 可 以 使 用 undo 命令 回 退 ， 如 下 所 示 : 


1d018000 
d2005£3£f 
al3b643b 
a0375937 
81334133 
8c2f£472£f 
6c2b1c2b 
49270a27 
d7229422 
731e2ele 
0alac619 
02156115 
3511ef10 
b40c6a0c 
ef07ac07 
00000000 








Iu 


n 


BBED» p ktbbh.ktbbhitl[0].ktbitflg 


ub2 ktbitflg 


(0) 
571 


35£90100 
173fdb3e 
233be33a 
££04d536 
tf32bf32 
022£c62e 
dc2a992a 
ce269126 
52220a22 
e81da21d 
86194619 
1e15d714 
b0105b10 
270ce00b 
69070000 
00000000 


有 务 状态 又 恢复 到 以 前 ， 如 下 : 


@60 


BBED> modify /x 0x0080 ktbbh.ktbbhitl[0].ktbitflg 


File: C:NVoracleNora92NdatadbNSYSTEMO1.DBF 
60 to 


Block: 62 


Offsets: 


(0) 
571 


a73a593a 
8d364d36 
83324332 
842e3e2e 
5d2a212a 
0726c725 
be217721 
591d101d 
f218b218 
91144714 
0510c20f 
990b550b 
00000000 
00000000 


1d3adc39 
0c36cb35 
0832cb31 
fd2dbe2d 
dc299729 
89254125 
3021eb20 
c6lc7cic 
72182f18 
fd13af13 
7£0£3a0£f 
0d0b840a 
00000000 
00000000 


0x0080 (NONE) 


'C:\oracle\ora92\datadb\SYSTEM01.DBF' block 62. 


Dba:0x00000000 


00800900 
9a3e5a3e 
a73a593a 
8d364d36 
83324332 
842e3e2e 
5d2a212a 
0726c725 
be217721 
591d101d 
f218b218 
91144714 
0510c20f 
990b550b 
00000000 
00000000 


0b1d25f7 
la3eda3d 
1d3adc39 
0c36cb35 
0832cb31 
fd2dbe2d 
dc299729 
89254125 
3021eb20 
c6lc7clc 
72182f18 
fd13af13 
7£0£3a0f 
0d0b840a 
00000000 
00000000 


0x2001 (KTBFUPB) 


Dba:0x00000000 


of 
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00800000 a53725f7 080044 
00018200 ffffb601 ff047f 
993d583d 183dd73c 9b3c5c 


00 5e0e4a00 
06 7£060000 
3c 1d3cdd3b 


95395839 1739da38 99385d38 1d38e137 


8e354635 0a35bc34 7d3440 


34 0334c233 


8a314b31 0831c530 89304430 1030cd2f 


7e2d3d2d fd2cbd2c 812c43 


2c 022cbc2b 


52290d29 cd288d28 442804828 cd278c27 


fe24b524 73243124 eb23a5 
a5205e20 1820d21f 901f4c 
321ce81b a21b5d1b 151bd0 
e7179b17 50170117 c41682 
6c132913 eal2ab12 681226 


23 5f231923 
1f 051fbcle 
la 8bla4ala 
16 4016fb15 
12 d1117b11 


f30ea80e 620e180e d30d8a0d 440dfa0c 


010ac309 7e093809 £608b5 
00000000 00000000 000000 


«32 bytes per line» 


BBED> p ktbbh.ktbbhitl[0] 
ub2 ktbitflg 


会 把 这 个 块 作为 坏 块 处 理 ， 代 码 
BBED> sum apply 


至 此 全 部 修改 完成 。 


08 74083308 
00 00000000 


.ktbitflg 


如 下 : 


1d018000 
d2005£3f 
al3b643b 
a0375937 
81334133 
8c2£472£ 
6c2b1c2b 
49270a27 
d7229422 
731e2ele 
0alac619 
52156115 
3511ef10 
b40c6a0c 
ef07ac07 
00000000 


35£90100 
173fdb3e 
233be33a 
££04d536 
ff32bf32 
022£c62e 
dc2a992a 
ce269126 
52220a22 
e81da21d 
86194619 
1e15d714 
b0105b10 
270ce00b 
69070000 
00000000 


@60 


修改 完成 后 , 需要 修改 数据 库 的 checksum (checkval) 的 值 , 否则 数据 块 的 校 验 不 对 , Oracle 


& 2 优化 小 技巧 ) 模拟 ORA-8102 及 处 理 过 程 


今天 老 白 在 讲 到 BBED 修改 索引 数据 时 只 是 点 到 为 止 , 可 能 大 家 心里 在 骂 老 白 不 够 厚道 , K 
际 上 修改 过 程 是 十 分 烦琐 的 ， 大 家 如 果 不 末 自 去 做 一 遍 ,， 是 设法 搞 明 白 的 。 因 此 ， 这 里 
模拟 测试 来 说 明 今天 处 理 ORA-8102 的 全 过 程 。 
通过 BBED, 将 con$ 表 中 _NEXT_CONSTRAINT 那 一 行 的 con# 从 6001 改 为 6000, 改 后 重启 


数据 库 ， 然 后 操作 : 


SQL> conn scott/tiger 
已 连接 。 
SQL> CREATE table tconl ( 


表 已 创建 。 








a integer); 


SOL» CREATE table tcon2( a integer not null); 
CREATE table tcon2( a integer not null) 


* 


ERROR 位 于 第 1 íT: 











ORA-00604: 递归 SOL E 1 出 现 错误 


ORA-08102: 未 找到 索引 关键 字 ， 





此 时 已 经 出 现 了 类 似 的 不 一 致 。 











obj# 49, dba 4277961 
通过 Trace 文件 发 现 : 


0x8000 


00800900 
9a3e5a3e 
a73a593a 
8d364d36 
83324332 
842e3e2e 
5d2a212a 
0726c725 
be217721 
591d101d 
£218b218 
91144714 
0510c20£ 
990b550b 
00000000 
00000000 


0b1d25£7 
la3eda3d 
1d3adc39 
0c36cb35 
0832cb31 
fd2dbe2d 
dc299729 
89254125 
3021eb20 
c6lc7clec 
72182f18 
fd13af13 
7£0£3a0f 
0d0b840a 
00000000 
00000000 


(KTBFCOM) 

















A 


122 Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





*** 2008-08-08 16:56:58.984 
*** SESSION ID: (12.7) 2008-08-08 16:56:58,984 
oer 8102.2 - obj# 49, rdba: 0x004146c9 
kdk key 8102.2: 
ncol: 1, len: 4 
key: (4): 03 c2 3d 05 


表 中 的 值 是 c2 3d 05 (6004) ， 通 过 Trace 文件 查看 索引 的 值 : 
BH (0x653EFC74) filets: 1 rdba: 0x004146c9 (1/83657) class 1 ba: 0x65273000 


col 0; len 2; (2): c2 3d 
row#135[632] flag: ----- , lock: 0, data:(6): 00 40 01 52 00 Oc 
col 0; len 3; (3): c2 3d 02 


索引 中 的 值 是 c2 3d 02 (6001) , 
下 面 需 要 将 索引 中 的 值 设置 为 和 表 中 一 致 ， 也 就 是 02 改 为 05。 
从 上 述 计算 : 632+44+24 x 这 模 位 数 〈 本 案例 是 2) =724。 从 724 开始 应 该 是 : 
00 00 00 40 01 52 00 Oc 03 3d 02 

因此 735 的 数值 是 02， 可 以 通过 BBED 来 确认 一 下 735 开始 的 数据 是 什么 : 


BBED>print 735 
rowdata[26] 


ubl rowdata[26] @735 0x02 

我 们 看 到 ，735 这 个 位 置 的 值 确实 是 我 们 所 计算 的 02， 因 此 如 果 要 解决 这 个 问题 ， 只 要 把 
735 这 个 位 置 的 02 修改 为 05 就 可 以 了 ， 启 动 BBED， 修改 735 的 值 ， 然 后 通 到 sum apply 修改 
一 下 这 个 数据 块 的 checksum 值 : 


BBED>set file 1 
BBED>set block 83657 
BBED>modify /x 0x05 735 
BBED>sum apply 


这 些 操作 完毕 后 ， 可 以 重启 数据 库 ， 然 后 测试 一 下 建 表 : 

SQL» create table tcon2( a integer not null); 

表 已 创建 。 
可 以 看 出 ， 使 用 BBED 已 经 成 功 解 决 了 问题 。 


错过 优化 山 技巧 ) 如 何 计算 数据 块 中 某 个 字段 的 位 置 
对 于 数据 块 来 说 ， 每 一 行 的 地 址 数据 可 以 通过 如 下 方式 获得 : 


buffer tsn: 0 rdba: 0x00400152 (1/338) 

scn: 0x0000.0150bef5 seq: 0x01 flg: 0x06 tail: Oxbef50601 

frmt: 0x02 chkval: 0xad32 type: 0x06-trans data 
Block header dump:  0x00400152 

Object id on Block? Y 

seg/obj: 0xlc csc: 0x00.150bef4 itc: 1 flg: - typ: 1 - DATA 
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fsl: 0 fnx: 0x0 ver: 0x01 


Itl Xid Uba Flag Lck Scn/Fsc 
0x01 0x0004.004.00006a8b 0x008001b1.070e.03  --U- 1 fsc 0x0000.0150bef5 


data block dump,data header at 0x3513044 


tsiz: Oxfb8 
hsiz: 0xi16c 
pbl: 0x03513044 
bdba: 0x00400152 











76543210 
flag=-------- 
ntab=1 
nrow=173 
frre=-1 
fsbo-0x16c 
fseo=0x232 
avsp=0x192 
tosp=0x192 
Oxe:pti[0] nrow=173 offs=0 
0x12:pri[0]offs=0xfa7 
0x14:pri[l]loffs=0xf95 
Ox16:pri[2]offs-0xf84 
0x18:pri[3]offs=0xf70 
Oxla:pri[4]offs=0xf5c 
Oxlc:pri[5]offs=0xf48 
Oxle:pri[6]offs=0xf36 
0x20:pri[7]offs=0xf24 
0x22:pri[8]offs=0xf10 
0x24:pri[9]offs=0xefc 
0x26:pri[10] offs=0xeea 
0x28:pri[11] offs=0xed8 








Ox2a:pri[12] offs=0x232 


tab 0, row 12, @0x232 

tl: 26 fb: --H-FL-- lb: 0x1 cc: 3 

col 0: [1] 80 

col 1: [16] 5f 4e 45 58 54 5f 43 4f 4e 53 54 52 41 49 4e 54 
col 2: [ 3] c2 3d 02 


从 上 面 可 以 看 到 , 第 13 行 的 位 置 是 0x232, 这 是 一 个 相对 地 址 , 需要 加 上 一 个 BASE。BASE 
的 计算 如 下 所 示 : 
O 对 于 字典 管理 表 空 间 ， 其 BASE 为 44+itcx24; 
O 对 于 本 地 管理 表 空 间 ， 其 BASE 为 52+itcx24; 

其 中 ite 是 ITL 槽 的 数量 ， 也 就 是 转 储 文件 里 icc 字段 的 值 (上 面 加 粗 部 分 )， 因 此 本 案例 
中 的 地 址 是 0x232+44+1 x 24=630。 其 中 630 指 的 是 这 一 行 行头 的 位 置 , 即 行头 应 该 以 0x2c 开始 : 


BBED> set file 1 
FILE# 1 


























BBED> set block 338 
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BLOCK# 


BBED> print 630 


rowdata[0] 


ubl rowdata[0] 


BBED» dump /v 


File: D:\Oracle\ORADATA\ORA92\SYS1 


Block: 338 


2c010301 
54524149 
5£4e4558 
02c23d2c 
4£4e5354 
0180105f 
49465402 
545f434f 
2c000301 
54524149 
4e455854 
c22b642c 
4£4e5354 
80105f4e 
4e5403c2 
43303031 
5359535£ 
0301800a 
02422c00 
363603c2 
43303031 
5359535f 
0301800a 
02462c00 
373003c2 
43303031 
5359535f 
0301800a 
02392c00 
353703c2 
43303031 
5359535f 








2c 01 03 这 


80105f4 


Offsets: 


e 


338 


4558545f 


4e5403c2 3d062c00 


545£434 
0003018 


524 
4e4 


c¢23d2c0 
4e53545 
801 
4e5402c 


5£4 


0003018 


1494 
5585 


05£4 


34£4 








524 


1494 


f 
0 
e 
4 
0 
2 
e 
2 
e 
0 


e 


4558545f 
2a642c00 
373303c2 
43303031 
5359535£ 
0301800a 
02432c00 
363703c2 
43303031 
5359535f 
0301800a 
02472c00 
363303c2 
43303031 
5359535f 
0301800a 
023a2c00 
353803c2 
43303031 


X 3 个 字 节 是 行头 ，2c 表示 这 是 一 个 普通 的 数据 行 ，01 表示 该 行 数据 使 用 1 号 


4e535452 
105f4e45 
5403c22c 
5f434f4e 
03018010 
41494e54 
4558545f 
2c2c0003 
53545241 
105f4e45 
5402c22b 
434£4e53 
0301800a 
024a2c00 
373103c2 
43303031 
5359535£ 
0301800a 
02442c00 
363803c2 
43303031 
5359535£ 
0301800a 
02402c00 
363403c2 
43303031 
5359535£ 
0301800a 
023b2c00 
353903c2 








ITL, 03 表示 这 行 有 3 个 字段 的 值 ， 


16， 表 示 这 个 字段 有 16 个 字 


10 5f 4e 45 58 54 5f 43 4f 4e 53 1 ,..... .NEXT CONS 


@630 


630 to 1141 


434£4e53 
03018010 
41494e54 
58545f43 
3a2c0003 
53545241 
5£4e4558 
03c22c39 
434£4e53 
0180105f 
494e5403 
58545£43 
2c000301 
54524149 
5359535£ 
0301800a 
02482c00 
363503c2 
43303031 
5359535£ 
0301800a 
02452c00 
363903c2 
43303031 
5359535f 
0301800a 
02412c00 
353603c2 
43303031 
5359535£ 
0301800a 
023c2c00 





01 80 表 


PRPPRPRPRPRP PPP PPP PPP PPP PPP PPP PPP rrr rre 


— fete 


7 


Ox2c 


TEMO1 .DBF (1) 


Dba:0x00400152 


TRAIND; Sipos 


Speeders _NEXT_C 
ONSTRAINT.., 

. NEXT CONSTRA 
INT. m... _NEX 
T CONSTRAINT..,9 
pee mes .NEXT CONS 
TRAINT..,;4... 


SEO ec .NEXT C 
ONSTRAINT. ;+ 
. NEXT CONSTRAI 


NT Gigs se SYS 
COOLT3 5.80 peng ders 
SYS C00171...H 
.SYS C00165.. 
Bresse SYS C001 
OG SC poem es SYS 一 
COO0L67 .De as 
SYS C00168...E 
.SYS C00169.. 
oP ype wee SYS_C001 
VO Gy das SYS_ 
00163 汪 人 
SYS C00164...A 
.SYS C00156.. 
"D SYS C001 
BT. ign SYS_ 
C00158. "TT 


SYS C00159...- 


紧 随 其 后 的 是 约束 的 名 字 ， 


人 字段 长 度 是 一 个 字 节 ，80 是 Oracle 数值 
类 型 的 内 部 表示 形式 ,表示 0 (在 con$ 表 中 ， 这 个 字段 是 owner BJ ID, ££ 
以 看 出 owner=0 表示 的 是 SYS "ld js 


经 验 的 DBA 一 眼 就 可 
第 一 个 字 节 0x10 是 十 进 制 的 
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54 52 41 49 4e 54 
以 上 16+1 个 字 节 就 是 _NEXT_CONSTRAINT， 后 面 就 是 con# 的 值 : 

03 c2 3d 06 

03 是 字段 长 度 ，c2 3a 06 表示 一 个 数值 。c2 表示 小 数 点 后 面 有 4 位 ，3d=61，61 一 1-60， 
06 一 1=05， 因 此 这 个 数值 是 6005, 


E 仿 优 化 小 技 厅 ) 如 何 计算 索引 块 中 某 个 字段 的 位 置 
通过 Trace 文件 中 的 索引 叶 节 点 信息 ， 可 得 


Block header dump:  0x0200557a 

Object id on Block? Y 

seg/obj: 0x31 csc: 0x00.23049f4 itc: 5 flg: 0 typ: 2 - INDEX 
fsl: 0 fnx: 0x200557b ver: 0x01 











Iti Xid Uba Flag Lck Scn/Fsc 
0x01 0x0002.003.00005edb 0x0080bcdc.0b96.01 CB-- 0 scn 0x0000.021b9dd5 
0x02 0x000a.012.000061e0 0x0080c84c.0b9d.15  --U- 4 fsc 0x003c.02304a14 
0x03 0x0006.02£.000061£7  Á0x0080c767.0c47.20  --U- 5 fsc 0x004b.02304de1 
0x04 0x0003.02a.00006239 .0x0080c9b1.0bff.1c C--- 0 scn 0x0000.023049de 
0x05 0x0007.000.000061ec 0x0080c8c4.0c59.0c --U- 4 fsc 0x003c.023049£f5 
Leaf block dump 
header address 13835058056894570660=0xc0000000601b60a4 
kdxcolev 0 
KDXCOLEV Flags - - - - 
kdxcolok 0 
kdxcoopc 0x80: opcode=0: iot flags---- is converted-Y 
kdxconco 1 
kdxcosdc 1 
kdxconro 193 
kdxcofbo 422z20x1a6 
kdxcofeo 5114=0x13fa 
kdxcoavs 5017 
kdxlespl 0 
kdxlende 13 
kdxlenxt 0=0x0 
kdxleprv 33576313=0x2005579 
kdxledsz 6 
kdxlebksz 7944 
row#192[5166] flag: ------ , lock: 0, len=13, data:(6): 00 40 00 aa 00 11 
col 0; len 4; (4): c3 45 42 0e 
索引 的 位 置 计 算 也 是 BASE+5166 (444+24*5+5166) , 





索引 记录 的 格式 为 : <LCK> 00 +ROWID+ 索 引 字 段 。 比 如 ， 本 例 的 索引 如 下 所 示 : 


00 00 00 40 00 aa 00 11 04 c3 45 42 0e 
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& 之 优化 小 技巧 ) 自己 动手 写 一 个 dul 


今天 老 白 用 BBED 修改 了 索引 的 值 , 这 里 涉及 一 个 十 分 大 的 话题 一 一 Oracle 数据 文件 的 物理 
结构 。 应 广大 读者 的 要 求 , 老 白 决定 将 本 节 的 “优化 小 技巧 ”扩展 开 来 ， 向 大 家 介绍 数据 文件 和 
数据 块 结构 方面 的 一 些 问 题 。 对 于 有 兴趣 的 朋友 ,完全 可 以 根据 这 一 章 的 内 容 ， 编 写 一 个 大 家 都 
很 向 往 的 Oracle 的 工具 。 不 过 老 白 在 这 里 介绍 的 还 是 一 些 比较 粗浅 的 理论 , 如 果 你 想 写 出 一 个 像 
dc.b.a 的 aul 这 样 的 工具 来 ， 还 是 需要 花费 很 多 心血 的 。 在 本 节 也 向 d.c.b.a 表示 致敬 。 

1. bootstraps 和 kcvfh 结构 

kcvfh 是 文件 头 结构 。 每 个 数据 库 的 系统 表 空 间 中 都 存在 一 个 超级 块 ， 这 个 块 位 于 文件 1 
的 1 号 块 。 我 们 首先 以 10GB 为 蓝本 来 看 一 下 kcvfh 结构 ， 其 代码 如 下 : 


struct kcvfh ( 











kcbh kcvfhbfh; /* 标准 块头 ， 每 个 块 都 有 的 结构 ，20 ^u */ 

kccfhg kcvfhhdr; 

krdba kcvfhrdb; /* 指向 bootstraps$ 的 RDBRA 地 址 ， 这 个 是 我 们 今天 要 关注 的 重点 ， 这 个 值 只 有 在 
FILE# 1 才 存 在 */ 

kscn kcvfhcrs; /* 文件 创建 的 SCN */ 

ub4 kcvfhcert; /* IFARA */ 

ub4 kcvfhrlc; 

kscn kcvfhrls; 

ub4 kcvfhbti; 

kscn kcvfhbsc; 

ub2 kcvfhbth; 


























ub2 kcvfhsta; 

ub4 kcvfhcpoc; 

ub4 kcvfhrts; 

ub4 kcvfhccc; 

kcvcpg kcvfhbcp; 

ub4 kcvfhbhz; 
kcvmxcd kcvfhxcd; 
ktsn kcvfhtsn; 

ub2 kcvfhtln; 

ktsn name t kcvfhtnm; 





) 
下 面 我 们 用 BBED 来 协助 分 析 ， 有 具体 代码 如 下 : 


BBED> set file 1 
FILE# 1 


BBED» set block 1 
BLOCK# 1 


BBED» map /v 
File: /opt/oracle/oradata/orcl/system01.dbf 


H 
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Block: 1 Dba:0x00400001 


Data File Header 


struct kcvfh, 676 bytes Q0 
struct kcvfhbfh, 20 bytes Q0 
struct kcvfhhdr, 76 bytes @20 
ub4 kcvfhrdb 896 

struct kcvfhcrs, 8 bytes 0100 
ub4 kcvfhcrt 8108 

ub4 kcvfhrlc 8112 

struct kcvfhrls, 8 bytes 0116 
ub4 kcvfhbti 80124 

struct kcvfhbsc, 8 bytes 0128 
ub2 kcvfhbth 8136 

ub2 kcvfhsta 0138 

struct kcvfhckp, 36 bytes 0484 
ub4 kcvfhcpc 8140 

ub4 kcvfhrts 8144 

ub4 kcvfhccc 8148 

struct kcvfhbcp, 36 bytes 0152 
ub4 kcvfhbhz 0312 

struct kcvfhxcd, 16 bytes 80316 
word kcvfhtsn 8332 

ub2 kcvfhtln 8336 

text kcvfhtnm[30] 8338 

ub4 kcvfhrfn 8368 

struct kcvfhrfs, 8 bytes 0372 
ub4 kcvfhrft 8380 

struct kcvfhafs, 8 bytes 0384 
ub4 kcvfhbbc 8392 

ub4 kcvfhncb 8396 

ub4 kcvfhmcb 8400 

ub4 kcvfhlcb 8404 

ub4 kcvfhbcs 8408 

ub2 kcvfhofb 8412 

ub2 kcvfhnfb 80414 

ub4 kcvfhprc 8416 

struct kcvfhprs, 8 bytes 0420 
struct kcvfhprfs, 8 bytes 0428 
ub4 kcvfhtrt 8444 











ub4 tailchk 88188 


BBED> print kcvfhrdb 
ub4 kcvfhrdb 896 0x00400179 


从 上 面 可 以 看 出 , bootstraps 对 应 的 地 址 是 0x00400179 (1/377) 。 下 面 我 们 来 看 看 1/377 
的 块 转 储 数据 : 


Start dump data blocks tsn: 0 file#: 1 minblk 377 maxblk 385 

buffer tsn: 0 rdba: 0x00400179 (1/377) 

scn: 0x0000.0000014e seq: 0x01 flg: 0x04 tail: 0x014e1001 

frmt: 0x02 chkval: 0xe733 type: 0x10=DATA SEGMENT HEADER - UNLIMITED 
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Hex dump of block: st=0, typ_found=1 

Extent Control Header 

Extent Header:: sparel: 0 spare2: 0 #extents: 1 #blocks: 7 
last map 0x00000000 #maps: 0 offset: 4128 

Highwater:: 0x0040017d ext#: 0 blk#: 3 ext size: 7 

#blocks in seg. hdr's freelists: 1 

#blocks below: 3 

mapblk 0x00000000 offset: 0 

Unlocked 

Map Header:: next 0x00000000 #extents: 1 obj#: 56 flag: 0x40000000 
Extent Map 


0x0040017a length: 7 


nfl- 1, nfb = 1 typ = 1 nxf = 0 cent = 3 
SEG LST:: flg: USED lhd: 0x0040017c 1tl1: 0x0040017c 


下 面 再 来 看 看 obj#=56 是 什么 对 象 ， 有 具体 代码 如 下 : 


SQL> SELECT name FROM sys.obj$ where obj#=56; 
NAME 


BOOTSTRAPS 


对 应 的 表 是 bootstrap$, mi bootstrap$ 是 个 什么 对 象 呢 ?下面 我 们 来 看 看 : 


SQL> desc sys.bootstraps 

名 称 是 否 为 空 ? 类 型 

LINE# NOT NULL NUMBER 

OBJ# NOT NULL NUMBER 

SQL_TEXT NOT NULL VARCHAR2 (4000) 





SQL> SELECT * FROM sys.bootstraps; 


LINE# OBJ# 





0 0 
CREATE ROLLBACK SEGMENT SYSTEM STORAGE ( INITIAL 112K NEXT 1024K MINEXTENTS 1 
MAXEXTENTS 32765 OBJNO 0 EXTENTS (FILE 1 BLOCK 9)) 











20 20 
CREATE TABLE ICOLS ("OBJ#" NUMBER NOT NULL, "BO#" NUMBER NOT NULL, "COL#" NUMBER NOT 





LINE# OBJ# 





NULL, "POS#" NUMBER NOT NULL, "SEGCOL#" NUMBER NOT NULL, "SEGCOLLENGTH" NUMBER NOT 
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NULL, "OFFSET" NUMBER NOT NULL, "INTCOL#" NUMBER NOT NULL,"SPARE1" NUMBER, "SPARE2" 
NUMBER, "SPARE3" NUMBER, "SPARE4" VARCHAR2 (1000) ,"SPARE5" VARCHAR2 (1000), "SPARE6" 
DATE) STORAGE ( OBJNO 20 TABNO 4) CLUSTER C_OBJ#(BO#) 


40 40 
CREATE INDEX I ICOL1 ON ICOLS (OBJ#) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
(INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 
40 EXTENTS (FILE 1 BLOCK 249)) 








28 28 
CREATE TABLE CONS ("OWNER#" NUMBER NOT NULL, "NAME" VARCHAR2(30) NOT NULL, "CON#" 


NUMBER NOT NULL, "SPARE1" NUMBER,"SPARE2" NUMBER, "SPARE3" NUMBER, "SPARE4" VARCHAR2 


(1000),"SPARE5" VARCHAR2(1000),"SPARE6" DATE) PCTFREE 10 PCTUSED 40 INITRANS 1 
MAXTRANS 255 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 
PCTINCREASE 0 OBJNO 28 EXTENTS (FILE 1 BLOCK 169)) 


48 48 


CREATE UNIQUE INDEX I CON1 ON CONS (OWNER#,NAME) PCTFREE 10 INITRANS 2 MAXTRANS 2 
55 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCRE 
ASE 0 OBJNO 48 EXTENTS (FILE 1 BLOCK 313)) 











49 49 


CREATE UNIQUE INDEX I CON2 ON CONS (CON#) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 




















( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 
OBJNO 49 EXTENTS (FILE 1 BLOCK 321)) 


LINE# OBJ# 


T5. T5 

CREATE TABLE UNDOS ("US#" NUMBER NOT NULL, "NAME" VARCHAR2(30) NOT NULL, "USER#" NUMBI 
NOT NULL, "FILE#" NUMBER NOT NULL, "BLOCK#" NUMBER NOT NULL,"SCNBAS" NUMBER," 
SCNWRP" NUMBER, "XACTSQN" NUMBER, "UNDOSQN" NUMBER, "INST#" NUMBER, "STATUS$" NUMBER 











NOT NULL, "TS#" NUMBER, "UGRP#" NUMBER, "KEEP" NUMBER, "OPTIMAL" NUMBER, "FLAGS" NUMBE 
"SPARE1" NUMBER, "SPARE2" NUMBER, "SPARE3" NUMBER, "SPARE4" VARCHAR2 (1000),"SPARE5" 
VARCHAR2 (1000), "SPARE6" DATE) PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255 
STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 
0 OBJNO 15 EXTENTS (FILE 1 BLOCK 105)) 




















LINE# OBJ# 


SQL_TEXT 
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34 34 

CREATE UNIQUE INDEX I UNDO1 ON UNDOS (US#) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 

OBJNO 34 EXTENTS (FILE 1 BLOCK 201)) 














35 35 
CREATE INDEX I UNDO2 ON UNDOS (NAME) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
(INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 





LINE# OBJ# 


35 EXTENTS (FILE 1 BLOCK 209)) 


29 29 

CREATE CLUSTER C_COBJ#("OBJ#" NUMBER) PCTFREE 0 PCTUSED 50 INITRANS 2 MAXTRANS 2 
55 STORAGE ( INITIAL 56K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCR 
ASE 0 OBJNO 29 EXTENTS (FILE 1 BLOCK 177)) SIZE 300 





IE: 


30 30 
CREATE INDEX I_COBJ# ON CLUSTER C_COBJ# PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 





LINE# OBJ# 


( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 
30 EXTENTS (FILE 1 BLOCK 185)) 


25 25 
CREATE TABLE PROXY ROLE DATAS("CLIENT4" NUMBER NOT NULL, "PROXY#" NUMBER NOT NULL, 
"ROLES" NUMBER NOT NULL) PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255 STORAGE 
( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 
25 EXTENTS (FILE 1 BLOCK 145)) 











26 26 
CREATE INDEX I PROXY ROLE DATAS 1 ON PROXY ROLE DATAS(CLIENT£,PROXY4) PCTFREE 10 
INITRANS 2 MAXTRANS 255 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 
2147483645 PCTINCREASE 0 OBJNO 26 EXTENTS (FILE 1 BLOCK 153)) 




















27 27 
CREATE UNIQUE INDEX I PROXY ROLE DATAS 2 ON PROXY ROLE DATAS (CLIENT#, PROXY#, ROLE#) 
PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 

1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 27 EXTENTS (FILE 1 BLOCK 161)) 

















LINE# OBJ# 
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17 17 

CREATE TABLE FILES ("FILE#" NUMBER NOT NULL, "STATUS$" NUMBER NOT NULL, "BLOCKS" 
NUMBER NOT NULL, "TS#" NUMBER, "RELFILE#" NUMBER, "MAXEXTEND" NUMBER, "INC" NUMBER, 
"CRSCNWRP" NUMBER, "CRSCNBAS" NUMBER, "OWNERINSTANCE" VARCHAR2 (30),"SPARE1" NUMBER, 
"SPARE2" NUMBER, "SPARE3" VARCHAR2 (1000) , "SPARE4" DATE) PCTFREE 10 PCTUSED 40 INITRANS 
1 MAXTRANS 255 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 214 
7483645 PCTINCREASE 0 OBJNO 17 EXTENTS (FILE 1 BLOCK 113) ) 











LINE# OBJ# 


41 41 

CREATE UNIQUE INDEX I_FILE1 ON FILES (FILE#) PCTFREE 10 INITRANS 2 MAXTRANS 255 
STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 
0 OBJNO 41 EXTENTS (FILE 1 BLOCK 257)) 








42 42 

CREATE UNIQUE INDEX I FILE2 ON FILES(TS#,RELFILE#) PCTFREE 10 INITRANS 2 MAXTRANS 
255 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTIN 
CREASE 0 OBJNO 42 EXTENTS (FILE 1 BLOCK 265)) 





LINE# OBJ# 


13 13 

CREATE TABLE UETS ("SEGFILE#" NUMBER NOT NULL, "SEGBLOCK#" NUMBER NOT NULL, "EXT#" 
NUMBER NOT NULL, "TS#" NUMBER NOT NULL, "FILE#" NUMBER NOT NULL, "BLOCK#" NUMBER 
NOT NULL, "LENGTH" NUMBER NOT NULL) STORAGE ( OBJNO 13 TABNO 1) CLUSTER 
C_FILE#_BLOCK# (TS#, SEGFILE#, SEGBLOCK# ) 





19 19 
CREATE TABLE INDS ("OBJ#" NUMBER NOT NULL, "DATAOBJ#" NUMBER, "TS#" NUMBER NOT NULL, 








"FILES" NUMBER NOT NULL, "BLOCK#" NUMBER NOT NULL, "BO#" NUMBER NOT NULL, "INDMETH 
OD#" NUMBER NOT NULL, "COLS" NUMBER NOT NULL, "PCTFREE$" NUMBER NOT NULL, "INITRANS" 
NUMBER NOT NULL, "MAXTRANS" NUMBER NOT NULL, "PCTTHRES$" NUMBER, "TYPE#" NUMBER 

NOT NULL, "FLAGS" NUMBER NOT NULL, "PROPERTY" NUMBER NOT NULL, "BLEVEL" NUMBER, "LEAFCNT" 
NUMBER, "DISTKEY" NUMBER, "LBLKKEY" NUMBER, "DBLKKEY" NUMBER, "CLUFAC" NUMBER, 
"ANALYZETIME" DATE, "SAMPLESIZE" NUMBER, "ROWCNT" NUMBER, "INTCOLS" NUMBER NOT NULL, 
"DEGREE" NUMBER, "INSTANCES" NUMBER, "TRUNCCNT" NUMBER, "SPARE1" NUMBER, "SPARE2" 
NUMBER, "SPARE3" NUMBER, "SPARE4" VARCHAR2(1000),"SPARE5" VARCHAR2 (1000), "SPARE6" 
DATE) STORAGE ( OBJNO 19 TABNO 3) CLUSTER C_OBJ#(BO#) 
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LINE# OBJ# 


39. 39 

CREATE UNIQUE INDEX I IND1 ON INDS(OBJ4) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 

OBJNO 39 EXTENTS (FILE 1 BLOCK 241)) 


T 

















14 14 
CREATE TABLE SEG$("FILE#" NUMBER NOT NULL,"BLOCK#" NUMBER NOT NULL, "TYPES" NUMBER 
NOT NULL, "TS#" NUMBER NOT NULL, "BLOCKS" NUMBER NOT NULL, "EXTENTS" NUMBER NOT 





LINE# OBJ# 


NULL, "INIEXTS" NUMBER NOT NULL, "MINEXTS" NUMBER NOT NULL, "MAXEXTS" NUMBER NOT NULL, 
"EXTSIZE" NUMBER NOT NULL, ""EXTPCT" NUMBER NOT NULL, "USER#" NUMBER NOT NULL, "LISTS" 
NUMBER, "GROUPS" NUMBER, "BITMAPRANGES" NUMBER NOT NULL, "CACHEHINT" NUMBER NOT 
NULL, "SCANHINT" NUMBER NOT NULL, "HWMINCR" NUMBER NOT NULL, "SPARE1" NUMBER, "SPARE2" 
NUMBER) STORAGE ( OBJNO 14 TABNO 2) CLUSTER C_FILE#_BLOCK# (TS#, FILE#, BLOCK#) 




















6 6 
CREATE CLUSTER C_TS#("TS#" NUMBER) PCTFREE 10 PCTUSED 40 INITRANS 2 MAXTRANS 255 


LINE# OBJ# 


STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 
0 OBJNO 6 EXTENTS (FILE 1 BLOCK 57) ) 











7 7 

CREATE INDEX I_TS# ON CLUSTER C_TS# PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
(INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 
7 EXTENTS (FILE 1 BLOCK 65)) 





2 21 
LINE# OBJ# 
SOL TEXT 








CREATE TABLE COLS ("OBJ#" NUMBER NOT NULL, "COL#" NUMBER NOT NULL, "SEGCOL#" NUMBE 
NOT NULL, "SEGCOLLENGTH" NUMBER NOT NULL, "OFFSET" NUMBER NOT NULL, "NAME" VARCHAR 
2(30) NOT NULL, "TYPE#" NUMBER NOT NULL, "LENGTH" NUMBER NOT NULL, "FIXEDSTORAGE" 
NUMBER NOT NULL, "PRECISION#" NUMBER, "SCALE" NUMBER, "NULL$" NUMBER NOT NULL, 
"DEFLENGTH" NUMBER, "DEFAULTS" LONG, "INTCOL#" NUMBER NOT NULL, "PROPERTY" NUMBER NOT 
NULL, "CHARSETID" NUMBER, "CHARSETFORM" NUMBER, "SPARE1" NUMBER, "SPARE2" NUMBER, 
"SPARE3" NUMBER, "SPARE4" VARCHAR2 (1000) ,"SPARE5" VARCHAR2(1000),"SPARE6" DATE) STORAGE 
( OBJNO 21 TABNO 5) CLUSTER C_OBJ#(OBJ#) 
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LINE# OBJ# 


45 45 

CREATE UNIQUE INDEX I COL1 ON COL$(OBJ#,NAME) PCTFREE 10 INITRANS 2 MAXTRANS 255 
STORAGE ( INITIAL 32K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 
0 OBJNO 45 EXTENTS (FILE 1 BLOCK 289)) 








46 46 

CREATE INDEX I COL2 ON COLS (OBJ#,COL#) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
( INITIAL 32K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 
46 EXTENTS (FILE 1 BLOCK 297)) 





LINE# OBJ# 


47 47 

CREATE UNIQUE INDEX I COL3 ON COLS (OBJ#,INTCOL#) PCTFREE 10 INITRANS 2 MAXTRANS 
255 STORAGE ( INITIAL 32K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 
0 OBJNO 47 EXTENTS (FILE 1 BLOCK 305)) 





























29 
CREATE TABLE CLUS ("OBJ#" NUMBER NOT NULL, "DATAOBJ#" NUMBER, "TS#" NUMBER NOT NULL, 
"FILES" NUMBER NOT NULL, "BLOCK#" NUMBER NOT NULL, "COLS" NUMBER NOT NULL, "PCTFREES" 








NUMBER NOT NULL, "PCTUSED$" NUMBER NOT NULL, "INITRANS" NUMBER NOT NULL, "MAXTRANS" 
NUMBER NOT NULL, "SIZES" NUMBER, "HASHFUNC" VARCHAR2 (30) ,"HASHKEYS" NUMBER, "FUNC" 
NUMBER, "EXTIND" NUMBER, "FLAGS" NUMBER, "DEGREE" NUMBER, "INSTANCES" NUMBER, "AVGCHN" 
NUMBER, "SPARE1" NUMBER, "SPARE2" NUMBER, "SPARE3" NUMBER, "SPARE4" NUMBER, "SPARE5" 
VARCHAR2 (1000), "SPARE6" VARCHAR2(1000),"SPARE7" DATE) STORAGE ( OBJNO 5 

TABNO 2) CLUSTER C_OBJ#(OBJ#) 


23.23 
CREATE TABLE PROXY_DATAS ("CLIENT#" NUMBER NOT NULL, "PROXY#" NUMBER NOT NULL, 


LINE# OBJ# 


"CREDENTIAL_TYPE#" NUMBER NOT NULL, "CREDENTIAL_VERSION#" NUMBER NOT NULL, "CREDENTIAL 
_MINOR#" NUMBER NOT NULL,"FLAGS" NUMBER NOT NULL) PCTFREE 10 PCTUSED 40 INITRANS 

1 MAXTRANS 255 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 214748 
3645 PCTINCREASE 0 OBJNO 23 EXTENTS (FILE 1 BLOCK 129)) 














24 24 
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CREATE UNIQUE INDEX I PROXY DATAS ON PROXY_DATAS (CLIENT#, PROXY#) PCTFREE 10 INITRANS 
2 MAXTRANS 255 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 21 
47483645 PCTINCREASE 0 OBJNO 24 EXTENTS (FILE 1 BLOCK 137)) 











LINE# OBJ# 


16 16 

CREATE TABLE TS$ ("TS#" NUMBER NOT NULL, "NAME" VARCHAR2(30) NOT NULL, "OWNER#" NUMBER 
NOT NULL, "ONLINE$" NUMBER NOT NULL, "CONTENTS$" NUMBER NOT NULL, "UNDOFILE#" 

NUMBER, "UNDOBLOCK#" NUMBER, "BLOCKSIZE" NUMBER NOT NULL, "INC#" NUMBER NOT NULL," 
SCNWRP" NUMBER, "SCNBAS" NUMBER, DFLMINEXT" NUMBER NOT NULL, "DFLMAXEXT" NUMBER NOT 
NULL, "DFLINIT" NUMBER NOT NULL, "DFLINCR" NUMBER NOT NULL, "DFLMINLEN" NUMBER NOT 
NULL, "DFLEXTPCT" NUMBER NOT NULL, "DFLOGGING" NUMBER NOT NULL, "AFFSTRENGTH" NUMBER 
NOT NULL, "BITMAPPED" NUMBER NOT NULL, "PLUGGED" NUMBER NOT NULL, "DIRECTALLOWED" 



































LINE# OBJ# 


NUMBER NOT NULL, "FLAGS" NUMBER NOT NULL, "PITRSCNWRP" NUMBER, "PITRSCNBAS" NUMBER, 
"OWNERINSTANCE" VARCHAR2 (30), "BACKUPOWNER" VARCHAR2 (30), "GROUPNAME" VARCHAR2 (30), 
"SPARE1" NUMBER, "SPARE2" NUMBER, "SPARE3" VARCHAR2(1000),"SPARE4" DATE) STORAGE 
( OBJNO 16 TABNO 2) CLUSTER C_TS#(TS#) 





43 43 

CREATE UNIQUE INDEX I TS1 ON TSS (NAME) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJ 

NO 43 EXTENTS (FILE 1 BLOCK 273)) 





LINE# OBJ# 


8 8 

CREATE CLUSTER C_FILE#_BLOCK#("TS#" NUMBER, "SEGFILE#" NUMBER, "SEGBLOCK#" NUMBE 
PCTFREE 10 PCTUSED 40 INITRANS 2 MAXTRANS 255 STORAGE ( INITIAL 24K NEXT 1024K 
MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 8 EXTENTS (FILE 1 BLOCK 
73)) SIZE 225 





9 9 
CREATE INDEX I_FILE#_BLOCK# ON CLUSTER C_FILE#_BLOCK# PCTFREE 10 INITRANS 2 MAXTRANS 








T 








LINE# OBJ# 


255 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 
0 OBJNO 9 EXTENTS (FILE 1 BLOCK 81)) 














10 10 
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CREATE CLUSTER C_USER#("USER#" NUMBER) PCTFREE 10 PCTUSED 40 INITRANS 2 MAXTRANS 
255 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 
0 OBJNO 10 EXTENTS (FILE 1 BLOCK 89)) SIZE 372 





























11 11 


LINE# OBJ# 


CREATE INDEX I_USER# ON CLUSTER C_USER# PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 
11 EXTENTS (FILE 1 BLOCK 97)) 





56 56 

CREATE TABLE BOOTSTRAPS ("LINE#" NUMBER NOT NULL, "OBJ#" NUMBER NOT NULL,"SQL TEXT" 
VARCHAR2(4000) NOT NULL) PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255 STORAGE 

( INITIAL 56K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 
56 EXTENTS (FILE 1 BLOCK 377)) 


LINE# OBJ# 


12 12 
CREATE TABLE FET$("TS#" NUMBER NOT NULL, "FILE#" NUMBER NOT NULL, "BLOCK#" NUMBER 
NOT NULL, "LENGTH" NUMBER NOT NULL) STORAGE ( OBJNO 12 TABNO 1) CLUSTER C_TS#(TS#) 


32 32 
CREATE TABLE CCOLS ("CON#" NUMBER NOT NULL, "OBJ#" NUMBER NOT NULL, "COL#" NUMBER NOT 
NULL, "POS#" NUMBER, "INTCOL#" NUMBER NOT NULL,"SPARE1" NUMBER, "SPARE2" NUMBER, 


LINE# OBJ# 


"SPARE3" NUMBER, "SPARE4" VARCHAR2 (1000),"SPARE5" VARCHAR2 (1000),"SPARE6" DATE) 
STORAGE ( OBJNO 32 TABNO 2) CLUSTER C_COBJ# (OBJ#) 


54 54 

CREATE INDEX I CCOL1 ON CCOLS (CON#,COL#) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 

OBJNO 54 EXTENTS (FILE 1 BLOCK 361)) 











CREATE UNIQUE INDEX I CCOL2 ON CCOLS$(CON#,INTCOL#) PCTFREE 10 INITRANS 2 MAXTRANS 
255 STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 
0 OBJNO 55 EXTENTS (FILE 1 BLOCK 369)) 
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22 22 

CREATE TABLE USERS ("USER#" NUMBER NOT NULL, "NAME" VARCHAR2(30) NOT NULL, "TYPE#" 
NUMBER NOT NULL, "PASSWORD" VARCHAR2 (30), "DATATS#" NUMBER NOT NULL, "TEMPTS#" NUMBER 
NOT NULL, "CTIME" DATE NOT NULL, "PTIME" DATE, "EXPTIME" DATE, "LTIME" DATE, "RESOURCES" 
NUMBER NOT NULL, "AUDITS" VARCHAR2 (38) ,"DEFROLE" NUMBER NOT NULL, "DEFGRP#" 









































LINE# OBJ# 


NUMBER, "DEFGRP_SEQ#" NUMBER, "ASTATUS" NUMBER NOT NULL, "LCOUNT" NUMBER NOT NULL, 
"DEFSCHCLASS" VARCHAR2(30),"EXT USERNAME" VARCHAR2 (4000) ,"SPARE1" NUMBER, "SPARE2" 
NUMBER, "SPARE3" NUMBER, "SPARE4" VARCHAR2(1000),"SPARE5" VARCHAR2 (1000) ,"SPARE6" 
DATE) STORAGE ( OBJNO 22 TABNO 1) CLUSTER C_USER# (USER#) 








44 44 

CREATE UNIQUE INDEX I USER1 ON USERS (NAME) PCTFREE 10 INITRANS 2 MAXTRANS 255 
STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 
OBJNO 44 EXTENTS (FILE 1 BLOCK 281)) 














LINE# OBJ# 


18 18 

CREATE TABLE OBJS$ ("OBJ#" NUMBER NOT NULL, "DATAOBJ#" NUMBER, OWNERS" NUMBER NOT 
NULL,"NAME" VARCHAR2(30) NOT NULL,"NAMESPACE" NUMBER NOT NULL,"SUBNAME" VARCHAR2 
(30),"TYPE#" NUMBER NOT NULL,"CTIME" DATE NOT NULL,"MTIME" DATE NOT NULL, "STIME" 
DATE NOT NULL, "STATUS" NUMBER NOT NULL, "REMOTEOWNER" VARCHAR2(30),"LINKNAME" VAR 
CHAR2(128),"FLAGS" NUMBER, OIDS$" RAW(16),"SPARE1" NUMBER, "SPARE2" NUMBER, "SPARE3" 
NUMBER, "SPARE4" VARCHAR2 (1000) ,"SPARE5" VARCHAR2(1000),"SPARE6" DATE) PCTFREE 
10 PCTUSED 40 INITRANS 1 MAXTRANS 255 STORAGE ( INITIAL 16K NEXT 1024K MINEXTENTS 




















LINE# OBJ# 


1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 18 EXTENTS (FILE 1 BLOCK 121) ) 


36 36 

CREATE UNIQUE INDEX I OBJ1 ON OBJ$(OBJ#) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 

OBJNO 36 EXTENTS (FILE 1 BLOCK 217)) 

















37 39 
CREATE UNIQUE INDEX I OBJ2 ON OBJS$ (OWNER: ,NAME,NAMESPACE,REMOTEOWNER, LINKNAME 





LINE# OBJ# 


SUBNAME) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE ( INITIAL 16K NEXT 1024K MINEXTENTS 
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1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 37 EXTENTS (FILE 1 BLOCK 225) 
) 


38 38 

CREATE INDEX I OBJ3 ON OBJS$(OID$) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
(INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 38 
EXTENTS (FILE 1 BLOCK 233)) 





LINE# OBJ# 


22 

CREATE CLUSTER C_OBJ#("OBJ#" NUMBER) PCTFREE 5 PCTUSED 40 INITRANS 2 MAXTRANS 25 

5 STORAGE ( INITIAL 136K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 
0 OBJNO 2 EXTENTS (FILE 1 BLOCK 25)) SIZE 800 


3-3 

CREATE INDEX I_OBJ# ON CLUSTER C_OBJ# PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 
3 EXTENTS (FILE 1 BLOCK 49)) 








LINES OBJ# 
SQL TEXT 
4 4 


CREATE TABLE TABS ("OBJ#" NUMBER NOT NULL, "DATAOBJ#" NUMBER, "TS#" NUMBER NOT NULL, 
"FILES" NUMBER NOT NULL, "BLOCK#" NUMBER NOT NULL, "BOBJ#" NUMBER, "TAB#" NUMBER, 
"COLS" NUMBER NOT NULL, "CLUCOLS" NUMBER, "PCTFREES$" NUMBER NOT NULL, "PCTUSED$" 
NUMBER NOT NULL, "INITRANS" NUMBER NOT NULL, "MAXTRANS" NUMBER NOT NULL, "FLAGS" NUMBER 
NOT NULL, "AUDITS" VARCHAR2 (38) NOT NULL, "ROWCNT" NUMBER, "BLKCNT" NUMBER, "EMPCNT" 
NUMBER, "AVGSPC" NUMBER, "CHNCNT" NUMBER, "AVGRLN" NUMBER, "AVGSPC_FLB" NUMBER, "FLBCNT" 
NUMBER, "ANALYZETIME" DATE, "SAMPLESIZE" NUMBER, "DEGREE" NUMBER, "INSTANCES" 

















LINE# OBJ# 


NUMBER, "INTCOLS" NUMBER NOT NULL, "KERNELCOLS" NUMBER NOT NULL, "PROPERTY" NUMBER 
NOT NULL, ""TRIGFLAG" NUMBER, "SPARE1" NUMBER, "SPARE2" NUMBER, "SPARE3" NUMBER, "SPARE4" 
VARCHAR2 (1000), "SPARE5" VARCHAR2(1000),"SPARE6" DATE) STORAGE ( OBJNO 4 TA 

BNO 1) CLUSTER C_OBJ# (OBJ#) 











33 33 
CREATE INDEX I TAB1 ON TABS (BOBJ#) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
(INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 33 
EXTENTS (FILE 1 BLOCK 193)) 
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31 31 

CREATE TABLE CDEFS ("CON#" NUMBER NOT NULL, "OBJ#" NUMBER NOT NULL,"COLS" NUMBER, 
"TYPES" NUMBER NOT NULL, "ROBJ#" NUMBER, "RCON#" NUMBER, "RRULES" VARCHAR2 (3), "MATCH#" 
NUMBER, "REFACT" NUMBER, "ENABLED" NUMBER, CONDLENGTH" NUMBER, "CONDITION" LONG, 
"INTCOLS" NUMBER, "MTIME" DATE, "DEFER" NUMBER, "SPARE1" NUMBER, "SPARE2" NUMBER, "SPARE3" 
NUMBER, "SPARE4" VARCHAR2 (1000) ,"SPARE5" VARCHAR2 (1000),"SPARE6" DATE) STORAGE 
( OBJNO 31 TABNO 1) CLUSTER C_COBJU# (OBJ#) 






































LINE# OBJ# 


50 50 

CREATE UNIQUE INDEX I_CDEF1 ON CDEFS (CON#) PCTFREE 10 INITRANS 2 MAXTRANS 255 
STORAGE ( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 
OBJNO 50 EXTENTS (FILE 1 BLOCK 329) ) 











541. 51 

CREATE INDEX I CDEF2 ON CDEFS (OBJ#) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE ( 
INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 

51 EXTENTS (FILE 1 BLOCK 337)) 





LINE# OBJ# 


52 52 

CREATE INDEX I CDEF3 ON CDEFS (ROBJ#) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 
52 EXTENTS (FILE 1 BLOCK 345)) 





53. 53 
CREATE INDEX I_CDEF4 ON CDEFS (ENABLED) PCTFREE 10 INITRANS 2 MAXTRANS 255 STORAGE 
( INITIAL 64K NEXT 1024K MINEXTENTS 1 MAXEXTENTS 2147483645 PCTINCREASE 0 OBJNO 





LINE# OBJ# 


53 EXTENTS (FILE 4 Broek 353) S 

已 选择 57 行 。 

bootstrap$ 里 包含 了 数据 库 创建 最 主要 的 系统 数据 字典 。 我 们 通过 bootstrap$ 可 以 找到 
obj$ 等 数据 字典 表 的 obj# 以 及 段 头 的 地 址 。 什 么 是 bootstrap WE? 从 计算 机 术语 上 来 看 : 


Bootstrap is a technique for loading the first few instructions of a computer program 
into active memory and then using them to bring in the rest of the program. 


如 果 一 个 软件 很 复杂 , 那么 在 软件 启动 时 需要 把 某 些 结构 先 载 和 内存， 以 便于 访问 其 他 的 软 
件 结构 ， 包 括 继续 局 动 软件 以 及 完成 软件 的 后 续 操 作 ， 这 段 代 码 一 般 我 们 就 称 bootstrap。 那 
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么 对 于 Oracle BHR, bootstrap 指 的 是 什么 呢 ? 


In Oracle, Bootstrap refers to loading of metadata (data dictionary) before we OPEN 
the database. 

Bootstrap objects are classified as the objects (tables / indexes / clusters) with the 
object id below 56 as bootstrap objects. 

These objects are mandatory to bring up an instance, as this contains the most important 
metadata of the database. 


这 段 文字 翻译 成 中 文 的 意思 就 是 Oracle 的 bootstrap 的 含义 是 在 数据 库 打 开 之 前 装载 元 数 
据 (数据 字典 数据 )。 一 般 来 说 ，object_ia 小 于 56 的 对 象 都 属于 bootstrap 对 象 ， 包 括 表 、 
索引 和 复 。 这 些 对 象 对 于 实例 启动 十 分 关键 。 

通过 bootstrap 的 概念 我 们 了 解 到 ， 要 想 去 分 析 Oracle 数据 库 的 结构 ， 首 先 需要 通过 
SUPER BLOCK 去 找到 bootstraps$ 的 位 置 ， 然 后 通过 bootstraps 中 的 数据 字典 定义 ， 找 出 
obj$,C_OBJ$, TABS#Il COL$ 等 主要 数据 字典 表 的 存储 信息 ， 然 后 找到 这 些 数 据 以 建立 数据 
字典 ， 并 通过 数据 字典 ， 找 到 所 需要 分 析 的 表 的 信息 ， 从 而 取出 这 些 数据 。 

今天 我 们 分 析 数 据 时 用 的 是 Oracle 10g 的 数据 结构 。 对 于 Oracle 9i 和 Oracle 8i 的 数据 结构 ， 
我 想 大 家 已 经 学 会 了 使 用 BBED， 那 么 通过 BBED 就 很 容易 分 析 清 楚 了 。 

2. 数据 块 的 结构 

本 节 将 通过 一 个 实际 例子 介绍 一 下 数据 块 的 结构 。 数 据 块 结构 是 dul 的 基础 。 这 里 介绍 的 是 
type: 0x06=trans data 的 数据 块 的 结构 〈 本 文 涉及 的 数据 库 版 本 为 Oracle 10.2.0.1)。 下 面 是 
一 个 块 的 逻辑 结构 : 


buffer tsn: 4 rdba: 0x0100a714 (4/42772) 

Scn: 0x0000.0025486e seq: 0x02 flg: 0x04 tail: 0x486e0602 
frmt: 0x02 chkval: Oxddfl type: 0x06-trans data 

Block header dump: 0x0100a714 

Object id on Block? Y 

seg/obj: 0xcc5c csc: 0x00.25486d itc: 3 flg: E typ: 1 - DATA 
brn: 0 bdba: 0x100a711 ver: 0x01 opc: 0 

inc: 0 exflg: 0 


























Itl Xid Uba Flag Lck Scn/Fsc 

0x01 Oxffff.000.00000000 0x00000000.0000.00 C--- 0 scn 0x0000.0025486d 
0x02 0x0000.000.00000000 0x00000000.0000.00 ---- 0 fsc 0x0000.00000000 
0x03 0x0000.000.00000000 0x00000000.0000.00 ---- 0 fsc 0x0000.00000000 


data block dump,data header at 0x8eb227c 


tsiz: Ox1f80 
hsiz: 0x16 

pbl: 0x08eb227c 
bdba: 0x0100a714 


76543210 

flag----- 

ntab-1 ---- 有 41 个 表 ， 如 果 是 CLUSTER, W[füEX 1 
nrow-2 ----- 有 2 行 
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fsbo=0x16 ---- 空 闲 空 间 的 开始 (44-NO. OF. ITLS*24«0X16) NO OF ITLS:itl 揪 模 的 数量 
fseo-0x1e70 ---- 空 闲 空 间 尾 部 (44+NO_OF ITLS*24 -«0x1e70) 





avsp=0xle5a 
tosp-0x1e5a 
Oxe:pti[0] nrow-2 offs=0 

















0x12:pri[0] offs-0x1f79 ---- 第 一 行 的 地 址 0x1£79- (44«NO. OF. ITLS*24) 
0x14:pri[1] offs-0x1e70 ---- 第 二 行 的 地 址 0xle70+ (44«NO. OF. ITLS*24) 
block row dump: 

tab 0, row 0, G0x1f79 --- 第 一 行 


tl: 7 fb: --H-FL-- lb: 0x0 cc: 2 
col 0: *NULL* 
































col 1: [ 2] c1 02 ---#ÍË 1 

tab 0, row 1, @0xle70 --- 第 二 行 

tl: 263 fb: --H-FL-- lb: 0x0 cc: 2 

col 0: [254] 

3132333435 3637 38 39 303132 33 34 35 36 37 38 39 30 31 32 33 34 35 
36 37 38 39 30 31 32 33.34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 
31 32 33 34 35. 36 37 38. 39 30. 31 32 33 34 35 36 37 38. 39.30 31 32 33 34 35 
36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 
3132333435 3637 38 39 303132 33 34 35 36 37 38 39 30 31 32 33 34 35 
3637 3839 303132 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 
3132333435 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 
36. 3T 38 39 30.31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 
31. 32 33 34 35 36 37 38.39 30 31 32 33 34 35 36 37 38.39 30 31 32 33 34 35 
36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 
31 32 33 34 

col 1: [2] cl 03 -- 数 值 2 


end of block dump 


下 面 通过 这 个 数据 块 对 应 的 裸 文件 来 分 析 : 


O00000000h: 06 A2 00 OO 14 A7 OO O1 6E 48 25 00 00 OO 02 04 ; .2..?.nH*..... 














DoooO0010h: Fi DD OO OO 01 OO OO OO 5C CC DOO OO 6D 48 25 00 ; i s..... 32.mH&. 
00000020h: OO OO OO OO 03 OO 32 OO 11 47 00 O1 FF FF OO OO; ...... 2..2. . 
00000030h: OO OO 00 OO OO OO OO OO OO OO OO OO OO 80 OO OO; ............. €.. 


00000040h: 6D 48 25 00 00 OO 00 00 OO 00 00 OO OO OO OO OO ; mHs............. 
DoooO0050h: 00 OO OO OO OO OO OO OO 00 00 OO OO OO OO OO OO ; ................ 
O0000060h: OO OO OO OO OO OO OO OO 00 OO OO OO OO OO OO OO ; ........... 
DooO00070h: 00 OO OO OO OO OO OO OO OO OO OO OO OO O1 O2 OO ; ............ 
O00000080h: FF FF 16 O0 70 1E SA 1E 54 1E 00 OO O2 OO 79 IF ; ..p.Z.Z..... y. 
00000090h: 70 1E OO OO OO OO OO OO OO OO OO OO 00 OO 00 OO ; p............... 
000000a0h: 00 00 00 OO 00 00 OO OO OO OO OO OO OO OO OO OO ; ............ e 
DOOO00050h: ROG DO OO OO OO OO OO OO OO OO OO OO OO OD OO ; ....... rr n m mm 
000000c0h: OO 00 00 OO OO 00 OO 00 OO OO OO OO OO OO OQ OO ; ................ 


上 面 我 们 看 到 的 似乎 杂乱 无 章 的 数据 ， 实 际 上 包含 了 十 分 高 明 的 数据 定义 。 在 分 析 Oracle 
数据 块 结构 时 ， 我 深 识 地 被 Oracle 精巧 的 设计 所 震撼 。 这 简直 就 是 一 种 艺术 。 在 下 面 的 篇 幅 中 ， 
我 将 带领 大 家 去 体会 这 种 叹为观止 的 艺术 。 

先 看 前 20 AFH: 


06 A2 00 00 14 A7 00 01 6E 48 25 00 00 00 02 04 
F1 DD 00 00 


这 20 个 字 节 对 应 的 结构 为 kcbh， 该 结构 的 定义 如 下 : 
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typedef struct kcbh ( 

ubi type kcbh; 

ubi frmt kcbh; 

ubl sparel_kcbh; 

ubl spare2 kcbh; 

krdba rdba kcbh; 

ub4 bas kcbh; /* SCN AY BASE 部 分 */ 
ub2 wrp kcbh; /*SCN AY WRAD 部 分 */ 
ubl seq kcbh; /* 相同 SCN 下 的 seq#*/ 
ubi flg kcbh; 

ub2 chkval kcbh; 

ub2 spare3 kcbh; 

) kcbh; 


第 0 个 字 节 为 类 型 : 06 表示 是 数据 块 。 第 1 个 字 节 是 frmt: 一 般 是 0x02, iX HUE Oxa2, 
用 掩 码 0x0f 取出 就 是 0x02。 第 4~7 个 字 节 14 A7 00 01 是 RDBA 0x100A714 (4/42772), X 
是 这 个 块 。 第 8 一 13 AEN 6E 48 25 00 00 00 是 scn (前 面 4 个 是 BASE， 后面 是 WRAP): 
0x254864.00。 第 14 个 字 节 02 是 SEQ; SEQ=0x02, #@ 15 个 字 节 04 是 标志 : flag=0x04。 第 
16~17 435 F1 DD 是 校 验 和 :，0xaqaf1l。 

正好 和 还 辑 转 储 的 数据 完全 吻合 : 


buffer tsn: 4 rdba: 0x0100a714 (4/42772) 
Scn: 0x0000.0025486e seq: 0x02 flg: 0x04 tail: 0x486e0602 
frmt: 0x02 chkval: Oxddfl type: 0x06-trans data 


下 面 我 们 来 看 接 下 来 的 24 NET: 


F1 DD 00 00 01 00 00 00 5C CC 00 00 6D 48 25 00 
00 00 00 00 03 00 32 00 11 A7 00 01 FF FF 00 00 


从 第 20 个 字 节 开始 的 24 个 字 节 对 应 的 结构 为 ktbbh， 该 结构 的 定义 如 下 : 


typedef struct ktbbh ( /* 10.2 版 本 的 块头 结构 */ 

ubl ktbbhtyp; /* 块 类 型 */ 

ub4 ktbbhsid; 

kscn ktbbhcsc; /* 最 后 一 次 cleanout 的 SCN */ 

b2 ktbbhict; /* itl 槽 的 数量 ， 这 个 数据 必须 先 和 0x00fE 做 按 位 与 操作 ， 取 其 低位 数据 */ 
ubl ktbbhflg; /* 标志 */ 

ubi ktbbhfsl; /* free space lock FSL*/ 

krdba ktbbhfnx; /* freelists 链 指针 */ 

) ktbbh; 


这 个 结构 共 占 20 个 字 节 。 第 20 个 字 节 01 表示 数据 块 的 类 型 为 1( 对 应 逻辑 转 储 的 cyp=01), 
第 24~27 个 字 节 对 应 逻辑 转 储 的 OBJECT ID, XE 5c cc 00 00 RMR ID, RATT SHE 
值 是 0xcc5c (注意 ,这 里 有 UB4 的 字 节 对 齐 问 题 ， 所 以 中 间 空 了 3 个 字 节 )。 第 28—35 PEG 
中 紧 接 着 的 6 个 字 节 6D 48 25 00 00 00 是 对 应 SCN 的 值 ， 其 值 是 0x0025486d.0000。 第 36— 
37 字 节 表示 ITL 插 槽 的 数量 ， 对 应 逻辑 转 储 中 的 itc, H 0x00ff 掩 码 后 就 是 ITL 插 槽 的 数量 ， 
03 00 表明 本 数据 块 有 3 个 IIL 槽 。 第 38 个 字 节 是 标志 : FLAG 32。 第 39 个 字 节 是 FSL， 这 里 
的 值 是 00。 第 40—43 个 字 节 是 KDBA， 表 示 下 一 个 空闲 的 数据 块 的 地 址 。11 A7 00 01 就 是 
十 六 进 制 的 0x100a711。 









































= 
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从 第 44 个 字 节 开始 是 ITL 表 ， 每 个 ITL 记录 的 长 度 为 24 个 字 节 。 可 以 看 到 ， 这 个 块 有 3 个 
ITL 槽 ， 因 此 ITL 占 72 个 字 节 。 下 面 我 们 开始 分 析 。 


F1 DD 00 00 01 00 00 00 5C CC 00 00 6D 48 25 00 
00 00 00 00 03 00 32 00 11 A7 00 01 FF FF 00 00 
00 00 00 00 00 00 00 00 00 00 00 00 00 80 00 00 


6D 48 25 00 
对 应 的 是 ktbit 结构 : 


struct ktbit { 
kxid ktbitxid; /* 事务 号 */ 























kuba ktbituba; /* 最 后 一 次 修改 undo 地 址 */ 


b2 ktbitflg; /* 块 中 锁 的 数量 * 


ktbitun t | ktbitun; 


ub4 ktbitbas; /* SCN 的 BASE 部 分 内 容 */ 


} 





ktbit 结构 是 从 第 44—5189 8 EP, HAA an BER. 


a UB2; SLOT NUMBER, 
Qa UB4: WRAP, 





Q UB2: UNDO Et NUMBER, 


BE 44—51 个 字 节 是 XID(8 字 节 ) :FF FF 00 00 00 00 00 00 ,就 是 十 六 进 制 的 Ox ££££.0000. 
00000000。 第 52—59 个 字 节 是 UBA (8 字 节 ): 00 00 00 00 00 00 00 00， 就 是 十 六 进 制 的 
0x00000000.0000.00, # 60—61 个 字 节 是 FLAG (2 字 节 ): 00 80， 表 示 十 六 进 制 的 0x0800, 


第 62 一 67 个 字 节 是 SCN (6 字 节 ): 


00 00 6D 48 25 00， 是 十 六 进 制 的 0x00254864.00, 





下 面 我 们 换 一 个 数据 块 来 继续 介绍 结构 ， 这 个 数据 块 的 逻辑 转 储 如 下 所 示 : 


tsiz: Ox1f98 

hsiz: 0x14 

pbl: O0x0cebec64 

bdba: 0x0100028e 
76543210 


frre--1 
fsbo=0x14 
fseo=0x1lf8e 
avsp=0x1f7a 
tosp=0x1lf7a 


Oxe:pti[0] nrow=1 offs=0 


0x12:pri[0] offs=0x1f8e 
block_row_dump: 

tab 0, row 0, @0x1f8e 

tl: 10 fb: --H-FL-- lb: 0x1 
col 0: [3] 3131 31 

col 1: [2] c1 03 

end of block dump 


Ges 2 
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这 个 块 有 2 个 ITL 槽 , 今后 所 有 的 位 置 都 要 根据 这 个 来 计算 。 下 面 是 一 个 重要 的 结构 kdbh: 


struct kdbh { 








ubl kdbhflag; /* 标志 */ 

ktno kdbhntab; /* 块 中 有 几 张 表 的 数据 */ 

ub2 kdbhnrow; /* 行 数 据 表 中 的 记录 数 */ 

sb2 kdbhfree; /* 第 一 个 空闲 行 的 位 置 */ 

sb2 kdbhfsbo; /* 块 中 空闲 地 址 的 起 始 偏 移 量 */ 

sb2 kdbhfseo; /* 块 中 空闲 地 区 尾部 的 偏 移 量 */ 

b2 kdbhavsp; /* 块 中 可 用 的 空闲 空间 ， 单 位 为 字 节 */ 
b2 kdbhtosp; /* 块 中 总 的 可 用 空间 * / 





) 
kdbh 结构 的 位 置 的 计算 方法 如 下 所 示 。 
O 对 于 ASSM (自动 段 空间 管理 ): 76+ (itls-1) x 24, 
a 对 于 MSSM (手工 段 空 间 管理 ): 68+ (itls-1) x 24, 
本 例 使 用 的 是 ASSM， 并 且 有 2 个 ITL 槽 ， 因 此 基准 偏 数量 是 76+ (2-1) x24=100。 下面 
我 们 来 看 这 部 分 数据 : 
00 00 00 00 00 01 01 00 FF FF 14 00 8E 1F 7A 1F 
7a 1f 00 00 01 00 8e 1f 


它 对 应 的 逻辑 结构 转 储 如 下 : 


100:FLAG 0(————— ) 
101:NTAB 1 

102-103:NROW 01 00: (nrow-1) 
104-105:frre ff ff (-1) 
106-107:fsbo 14 00:0x14 
108-109:fseo 8e 1f:0x1f8e 
110-111:avsp 7a 1f: Ox1f7a 
112-113:tosp 7a 1f: Ox1f7a 


紧 跟着 的 数据 结构 是 kabt 结构 ， 是 一 个 数组 ， 在 一 个 数据 块 中 ， 每 个 表 有 一 行 记 录 (对 于 
CLUSTER 表 ， 可 能 有 多 行 ， 对 于 普通 表 ， 只 有 一 行 )， 数 据 结构 如 下 : 


struct kdbt ( 

b2 kdbtoffs; /* kdbpri 结构 中 的 偏 移 量 */ 
b2 kdbtnrow; /* 记录 数量 */ 

} 


下 面 的 数据 就 是 这 个 例子 中 的 : 


114-115: 00 00:0x0000 
116-117: 01 00 :0x0001 (这 个 块 有 1 行 数据 ) 


由 于 这 张 表 不 是 CLUSTER K, HDA kdbpri 结构 的 偏 移 量 是 0, 而 且 这 个 数据 块 中 ,这 张 表 
只 有 一 条 记录 。 下 面 紧 接着 是 kdor 结构 。 该 结构 是 一 个 数组 , 是 sb2 类 型 (sb2 相当 于 short, 
2 个 字 贡 长 ) 的 ， 指 向 每 一 行 的 头 。 这 里 只 有 1 行 ， 指 向 0x1f8e。 对 于 ASSM， 加 上 76 就 是 这 
个 记录 的 位 置 : 0x1f8e+76+24=8178 (0x1FF2) 。 找 出 下 面 这 些 数 据 ; 


00 01 02 03 04 05 06 07 08 09 OA OB OC OD OE OF 
04 00 2c 01 02 03 31 31 31 02 c1 03 
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其 中 2c 是 行 的 开头 ， 属 于 kdrh 结构 : 


ubi kdrhflag; /* 行 状态 标志 
ubi kdrhlock; /* itl 指针 */ 
ubl kdrhecnt; /* 该 行 数据 的 字段 数量 */ 


2c 是 记录 头 的 标志 。 

01; ITL 槽 的 索引 〈 锁 所 在 的 ITL 槽 的 编号 ) 。 

02: 字段 的 数量 ，0x02 表示 这 个 记录 有 2 个 字段 。 

后 面 是 第 一 个 字段 的 数据 : 

03: 31: 31. 31 

03 表示 字段 长 度 ， 后 面 3 个 31 就 是 字符 串 '111 ' : 

02 c1 03 

第 二 个 字段 是 Number 类 型 ， 长 度 是 2 (02), C103 是 数值 2 的 内 部 表示 。 大 家 可 以 看 到 这 
个 数据 块 里 只 有 一 条 记录 ， 这 条 记录 是 在 这 个 块 的 尾部 ， 数 据 块 里 的 数据 是 从 底部 向 上 增长 的 。 
紧 跟 在 后 面 这 个 块 的 最 后 4 个 字 节 是 块 尾 , 块 尾 的 4 个 字 节 的 组 成 分 为 两 部 分 ， 其 中 前 两 个 字 节 
分 别 是 这 个 数据 块 的 sq 和 typ， 在 这 个 例子 里 是 : 

01 06 
其 中 01 是 seq，06 是 数据 块 的 typ， 也 就 是 块 的 类 别 ，06 表示 数据 块 。 数 据 块 的 最 后 两 个 字 节 
是 scn base 的 低 4 个 字 节 : 0x7763。 这 个 块 的 SCN 是 0x005f7763。 我 们 可 以 看 出 ， 块 尾 的 
这 3 部 分 数据 都 是 块头 中 有 的 。Oracle 为 什么 要 设计 这 么 一 个 看 似 重复 的 机 制 呢 ? 实际 上 , Oracle 
的 一 个 数据 块 的 大 小 和 操作 系统 物理 VO 的 块 大 小 是 不 同 的 ,因此 一 个 数据 块 的 读 取 可 能 在 多 个 
不 同 的 物理 VO 中 完成 ， 因 此 就 有 可 能 产生 数据 读 取 的 不 一 致 性 ，Oracle 使 用 块 尾 来 确保 数据 块 
读 取 的 一 致 性 。 

要 注意 的 是 ， 这 个 例子 是 最 简单 的 。 如 果 字 段 的 长 度 超过 253 个 字 节 ， 那 么 8 位 是 表示 不 了 
的 ， 这 时 ， 会 使 用 前 导 字 符 FE. LEA, FE 03 06 表示 该 字段 的 长 度 是 0x603 ， 就 是 1 539 个 字 
节 。 要 注意 的 是 ， 在 数据 块 里 面 没 有 字段 类 型 ， 因 此 如 果 系 统 表 空间 损坏 ,需要 导出 数据 ， 就 必 
须 了 解 表 的 结构 ， 否 则 需要 根据 扫描 的 结果 进行 猜测 。 

3. 写 dul 的 第 一 步 

刚才 老 白 和 大 家 讨论 了 数据 块 的 物理 结构 和 逻辑 结构 之 间 的 关系 。 实际 上 根据 刚才 的 讨论 结 
果 ， 有 一 定编 程 经 验 的 DBA 应 该 具备 了 写 一 个 简单 dul 的 条 件 了 。 是 不 是 有 些 人 已 经 跃跃欲试 
T? 那 我 们 现在 就 开始 吧 。 首 先 编写 一 个 简单 的 程序 ， 简 要 分 析 一 下 数据 文件 的 某 一 个 数据 块 ， 
代码 如 下 : 


int main(argc,argv) 








int BLOCKSIZE-8192; /* 这 必须 等 于 aqb_ block size */ 
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char *filename; /* 数据 文件 名 */ 
int orablocks; /* 数据 文件 中 包含 的 数据 块 的 数量 */ 

int i; /* 计数 器 */ 
char blockbuffer[68000]; 

int fd; 

struct stat fileinfo; 

int blockid; 


char *block header; 
if(argc«3) 
{ 
printf("usage :blockcheck «filename» <blocksize> <block#>\n") ; 
exit(-1); 


filename=argv[1]; 
if (filename==NULL) 
{ 
printf("usage :blockcheck «filename» <blocksize> <block#>\n"); 
exit(-1); 


) 
BLOCKSIZE-atoi(argv[21); 
if (BLOCKSIZE<=0) 
t 
printf ("usage :blockcheck «filename» <blocksize> <block#>\n"); 
exit(-1); 


blockid-atoi (argv[3]); 
if (blockid<=0) 
{ 
printf("usage :blockcheck «filename» <blocksize> <block#>\n") ; 
exit(-1); 
} 
printf ("bc-I-begin to check file[$s]-block[$d],blocksize[$d], 
OFFSET [%d] \n", filename, blockid, BLOCKSIZE, OFFSET); 
// 打 开 数 据 文件 
If((fdq=open(filename,O_RDONLY) )<0) 
exit(1); 








if(fstat(fd,&fileinfo )«0) 
exit(1); 
printf ("blocksize=%d, OFFSET=%d\n" , BLOCKSIZE, OFFSET); 
orablocks=fileinfo.st_size/ (BLOCKSIZE-OFFSET) ; 
printf ("blocks=%d\n",orablocks) ; 


#ifndef LINUX 
if (lseek(fd,OFFSET,SEEK_SET) <0) 
exit(-1); 
#endif 
printf ("bc-I-begin to allocate block header buffer\n"); 
block header-zmalloc (BLOCKSIZE) ; 
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// 定 位 数据 块 的 位 置 
if (lseek (fd, BLOCKSIZE* (blockid) , SEEK_SET) <0) 
exit(1); 
// 读 出 数据 块 
if (read(fd,blockbuffer,BLOCKSIZE) <0) 


exit(1); 
printf("bc-I-read block[$d] success...\n",blockid) ; 
block header-&blockbuffer[0]; 
// 调 用 图 数 print bh 打印 块头 信息 
print bh(block header); 
return(0); 


) 

上 面 这 段 代 码 应 该 很 容易 读 懂 ， 其 中 调用 的 print bh 函数 的 内 容 如 下 : 
0 
1 


define FALSE 
define TRUE 
define NUMORABLOCK(fsize,orabsize) \ 
((fsize--(orabsize-OFFSET)) ? (1) : ((fsize/(orabsize-OFFSET))-1)) 


define FILE ID(dba) (dba »» 22) /* 将 aqba 右 移 22 位 以 得 到 文件 */ 








define BLOCK ID(dba) (dba & 0x3fffff)/* 取 低位 22 位 计算 出 数据 块 的 块 号 */ 


define CHECKCONDITION(bh) ((bh->type==6) && (bh->flg & 0x4)) 

define PRINT HEADER(bh) fprintf (stdout,\ 
"file# %d,block# $d Nn type: Ox$x fmt: Ox%x rdba: 0x%x base SCN: 0x%xN 
\n wrap SCN: 0x%x chk: Ox$x", BLOCK_ID(bh->rdba) , \ 
FILE_ID(bh->rdba) ,bh->type, bh->Fmt, bh->rdba, bh->bas, bh-»wrp, bh-»cks) 








#define PRINT_COMPUTED_CHECKSUM(bh,cks) fprintf(stdout, \ 
" [kcbhxor: 0x%x]\n\n",cks) 

#define PRINT FILEINFO(fname,fstat,orablocks) N 
fprintf(stdout,"name: %s size: $d n-blocks: %d\n", fname, \ 
fstat.st size,orablocks) 

typedef struct bh { 











ubi type; /* 类 型 */ 
ubi Fmt; /* 格式 */ 
ubi zt /* 保留 字段 */ 
ubl r2; /* 保留 字段 ey 
ub4 rdba; /* rdba 数据 块 地 址 
ub4 bas; /* SCN 的 BASE 部 分 */ 
ub2 wrp; /* SCN 的 WRAP 部 分 */ 
ubi seq; /* 相同 SCN 下 的 序号 */ 
ub1 flg; /* 块 标志 S 
ub2 cks; /* checksum T. 
ub1 r3; /* 对 齐 使 用 */ 

ub1 r4; /* 字 对 齐 使 用 */ 


} block header; 
typedef struct kxid { /* struct kxid */ 























ub2 kxidusn; /* undo 段 的 号 */ 
ub2 kxidslt; /* undo 事务 模 */ 
ub4 kxidsqn; /* wrap */ 


) kxid st; 
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typedef struct kuba { /* struct kuba undo block 地 址 */ 


ub4 kubadba; /* RDBA, 块 地 址 */ 
ub2 kubaseq; /* 序号 */ 
ubi kubarec; /* 块 内 记录 号 */ 

} kuba st; 


typedef struct ktbbh 

















{ 

ubi ktbbhtyp; 

ubi spl; 

ub4 object_id; 

ub4 kscnbas; /* SCN BJ BASE 部 分 */ 
ub2 kscnwrp; /* SCN AY WRAP 部 分  */ 
ub2 itlno hi; 
ubi itlno; 
ubi flags; /* 0x01: 在 freelists 上 。0x10: 使 用 位 图 */ 
ubi fsl; /* 空闲 空间 锁 * / 
ub4 krdba; /* 下 一 个 空闲 块 的 RDBA*/ 

)ktbbh st; 


typedef struct kbh( 
block header bh; 
ktbbh st kbh bbh; 
ktbit st kbh it; 

) kbh st; 


void print bh(kbh st *buffer) 

{ 
printf( 

Files %d,block# $d Nn type: Ox£x fmt: Ox%x rdba: 0x%x base SCN: 0x%x Mn wrap SCN: 

Ox$x chk: Ox%x seq=0x%x flg=0x%x\n", 
FILE ID(buffer-»bh.rdba), 
BLOCK ID(buffer-»bh.rdba), 
buffer->bh.type, buffer->bh.Fmt, 
buffer->bh.rdba,buffer->bh.bas, 
buffer->bh.wrp, buffer-»bh.cks, 
buffer->bh.seq, buffer->bh.flg) š 





printf( 
"Type:0x%x objid:$d scn:0x%x/0x%x itls:%d flags:0x%x fsl:0x$x next: 
0x%x (%d/%d) \n", 
buffer->kbh_bbh.ktbbhtyp, 
buffer->kbh_bbh.object_id,buffer->kbh_bbh.kscnbas, 
buffer-»-kbh bbh.kscnwrp,buffer-»kbh bbh.itlno&O0XO00FF, 
buffer-»kbh bbh.flags,buffer-»kbh bbh.fsl, 
buffer->kbh_bbh.krdba, 
FILE_ID(buffer->kbh_bbh.krdba) , 
BLOCK, ID(buffer-»kbh bbh.krdba)); 

if(buffer-»bh.Type--6) 

print itl(block header,buffer-»kbh bbh.itlno&0XO00FF); 
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这 里 调用 了 print_itl 函数 ， 这 个 函数 的 内 容 如 下 : 
void print itl(char * buffer,int count) 


{ 


int i; 

ktbit st *itls; 

char flg[5]; 

itls-(ktbit st *) (buffer+44) ; 

print£("\n Itl Xid Uba Flag Lck Scn/FscNn"); 


for (i=0;i<count; i++) 
{ 
get flg(itls[i].ktbitflg,flg); 
printf ("0x%03x 0x%04x.%03x.%08x 0x%08x.%04x.%02x SS $d $s 
0x%04x.%08x\n",i+1,itls[i].ktbitxid.kxidusn, 


itls[i].ktbitxid.kxidslt,itls[i].ktbitxid.kxidsqn,itls[i].ktbituba.kubadba,itls[i]. 
ktbituba.kubaseq,itls[i].ktbituba.kubarec, 
flg,itls[i].ktbitflg&OxOOff,flg[0]-2'C'?"scn":"fsc",itls[i].ktbiwrap,itls[i]. 
ktbitbas); 
) 
} 


其 中 get_flg 的 定义 如 下 : 


void get flg(ub2 flag,char *flg) 
t 


if(flag&0x8000) 





flg[0]s'C'; 
else 
flg[0]2'-'; 
if(flag&0x4000) 
flg[1]='B'; 
else 
flg[1]s'-'; 
if(flag&0x2000) 
flg[2]5'U'; 
else 
flg[2]='-'; 
if (flag&0x1000) 
flg[3]&e'pP's 
else 
flg[3]s^-'; 
flg[4]='\0'; 





} 
上 面 程序 的 执行 结果 如 下 : 


bc-I-begin to check file[D: ORACLENORADATANORCLNORCLNUSERSO1.DBF]-block[40708], 
blocksize[8192], OFFSET[0] 

file id-3 

blocksize=8192,OFFSET=0 

blocksize=8192,OFFSET=0 

blocks=82721 
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% 


bc-I-begin to allocate block header buffer 
bc-I-read block[40708] success... 

filets 4,block# 40708 

type: 0x6 fmt: 0xa2 rdba: 0x1009f04 base SCN: 0xfe622 

wrap SCN: 0x0 chk: 0x2882 seq=0x5 flg=0x6 
Type:0x1 objid:51588 scn:0xfe5ab/0x0 itls:3 flags:0x0 fs1:0x32 next:0x1009f01 (4/40705) 


Itl Xid Uba Flag Lck Scn/Fsc 

0x001 Oxffff.000.00000000 0x00000000.0000.00 C--- 0 scn 0x0000.000fe5ab 
0x002 0x0005.018.00000189 0x00801e2a.012c.22 --U- 4 fsc 0x0000.000fe622 
0x003 0x0000.000.00000000 0x00000000.0000.00 ---- 0 fsc 0x0000.00000000 


本 市 中 ， 我 们 完成 了 一 个 读 取 数 据 块 的 小 程序 。 实 际 上 ， 编 写 dul 工具 与 编 本 市 的 这 个 小 程 
样 ， 只 要 我 们 按部就班 地 剖析 数据 文件 和 数据 块 ， 就 完全 可 以 将 数据 读 取出 来 。 





m- 优化 由 技巧) bootstrap$ 的 访问 


从 超 
7R: 


有 了 上 面 的 练习 ， 我 们 就 可 以 正式 编写 dul 了 。 今 天 我 们 首先 处 理 1 号 数据 文件 的 超级 块 ， 
级 块 获取 pootstrap$ 对 象 的 信息 ， 从 而 找 出 obj$、tab$ 之 类 的 对 象 的 obj#， 代 码 如 下 所 





void bootstrap() 
{ 
tsFiles TsFileList; 
int i; 
int FileCount; 
ink fp; 
char Msg[80]; 
ub4  *BootStrapDba; 
kcvfh *fh; 
int Ret; 
etmap ObjMap; 
blockListStruc BlockList[100000]; 
int BlockCount; 


printTraceMsg(0,'I',"This is bootstrap function"); 
FileCount-indexTsFiles(&TsFileList,0,ParameterList.db block size); // 查找 所 有 的 数据 文 从 
for (i=0;i<TsFileList.FileCount; i++) 
{ 
printf ("JUSDUL-I-0000,trace system file[%s]\n",FileList[TsFileList.TsPt[i]].FileName) ; 
} 


T 





if (FileCount<=0) 

{ 

fatalError (FOP_ERR_OPENTSERR) ; 

} 
else 

printTraceMsg(0,'I', "Index system table space OK,Will going to do bootstrap..."); 
// 打 开 1 号 文件 ，1 号 文件 肯定 是 system 表 空 间 的 第 一 个 文件 

fp-open(FileList[TsFileList.TsPt[0]].FileName,O RDONLY); 

if(fp«0) 
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sprintf(Msg,"Can not open system tablespace to do 
bootstrap[$s]",FileList[TsFileList.TsPt[0]].FileName); 
printTraceMsg(-9999,'F',Msg); 
exit(-1); 
H 
// 定 位 到 文件 头 
if(lseek(fp,ParameterList.db block size,SEEK SET)«0) 
{ 
sprintf (Msg, "Can not lseek system tablespace to do 
bootstrap[$s]",FileList[TsFileList.TsPt[0]].FileName); 
printTraceMsg(-9999,'F',Msg); 
exit(-1); 








} 
// 读 出 文件 的 第 一 个 块 
(read(fp,BlockBuffer,ParameterList.db block size)<=0) 
{ 
sprintf (Msg, "Can not read system tablespace to do 
bootstrap[$s]",FileList[TsFileList.TsPt[0]].FileName); 
printTraceMsg(-9999,'F',Msg); 
exit(-1); 
H 
// 将 kcvfh* 类 型 的 fh 指向 读 出 缓冲 区 的 头 ，fh->kcvfhrdb 就 是 超级 块 的 地 址 
fh=(kcvfh *)&(BlockBuffer[0]); 
printf("JUSDUL-I-0000,BootStrap block address [0x%x] \n", fh->kcvfhrdb); 
// 定 位 文件 到 超级 块 所 在 的 数据 块 
if(lseek(fp,ParameterList.db block size*BLOCK ID(fh-»-kcvfhrdb),SEEK SET)«0) 
{ 
sprintf (Msg, "Can not lseek system tablespace 2 to do 
bootstrap[$s]",FileList[TsFileList.TsPt[0]].FileName); 
printTraceMsg(-9999,'F',Msg); 

















exit(-1); 
H 
// 读 出 超级 块 
if(read(fp,BlockBuffer,ParameterList.db block size)<=0) 
{ 


sprintf (Msg, "Can not read system tablespace 2 to do 
bootstrap[$s]",FileList[TsFileList.TsPt[0]].FileName); 
printTraceMsg(-9999,'F',Msg); 
exit(-1); 
H 
// 超 级 块 的 108 字 节 就 是 bootstrap$ 的 RDBA 
BootStrapDba-(ub4 *)&(BlockBuffer[108]); 


printf ("bootstrapdba=0x%08x\n", *BootStrapDba) ; 
// 取 出 bootstzraps 的 数据 
unloadBootStrap(fp,*BootStrapDba,FileList[TsFileList.TsPt[0]].FileName); 
// 关 闭 文 件 ， 完 成 第 一 阶段 的 bootstraps$ 的 下 载 工作 
close(fp); 
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unloadBootStrap 是 从 数据 文件 中 将 bootstraps 表 的 数据 读 出 来 ， 写 到 文件 中 ， 其 代码 
如 下 : 


int unloadBootStrap(int fvp,int BootStrapDba,char *FileName) 
{ 
colStruc TypeList; 
colStruc ClusterTypeList; 
char Msg[80]; 
ktbbh *bh; 
FILE *fp,*fpDel; 
int Ret; 
// 打 开 bootstrap.Data， 将 读 出 的 数据 写 入 到 这 个 文件 中 
fp=fopen ("bootstrap.data", "w+"); 
if (fp==NULL) 

















{ 
sprintf(Msg,"Can not open bootstrap.data to write,ERROR[$d]",errno); 
printTraceMsg('F',FOP ERR CREATEFILE,Msg); 
exit(-1); 

) 


// 将 bootstraps 中 状态 为 删除 状态 的 行 写 入 bootstrap.del 中 
// 有 时 候 读 出 刚刚 被 删除 的 行 也 是 很 有 意义 的 
fpDel=fopen("bootstrap.del", "w+"); 
if (fpDel==NULL) 





{ 
sprintf (Msg, "Can not open bootstrap.del to write, ERROR[%d]",errno) ; 
printTraceMsg('F',FOP ERR CREATEFILE,Msg); 
exit(-1); 

) 


sprintf(Msg,"Open file ok,begin to unload bootstrap$"); 
printTraceMsg('I',0,Msg); 
/FÉBBoSiEidMEAS, H TF E, Eb 
/ /设置 列 的 数量 以 及 每 个 列 的 类 型 
TypeList.ColCount-3; 
TypeList.ColType[1]-TYPE NUMBER; 
TypeList.ColType[2]-TYPE NUMBER; 
TypeList.ColType[3]-TYPE VARCHAR2; 
/ XA FETA), UPA EEA 
ClusterTypeList.ColCount=0; 














Ts 


虽然 不 太 规 范 ， 不 过 老 白 自己 用 的 还 可 以 











hi 


























printf("JUSDUL-I-0000,BootStrap block SegmentHdr address [0x%x]\n",BootStrapDba); 
printf("blockis 
[$d],pos[$d]Mn",BLOCK ID(BootStrapDba),ParameterList.db block size* (BLOCK ID 
(BootStrapDba))); 


if(lseek(fvp,ParameterList.db block size* (BLOCK ID(BootStrapDba)),SEEK SET)«0) 
{ 














sprintf(Msg,"Can not lseek system tablespace 3 to do 
bootstrap[%s],errno[%d]",FileName, errno) ; 
printTraceMsg('F',-99,Msg); 
exit(-1); 
} 
if(read(fvp,BlockBuffer,ParameterList.db block size)«-0) 
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sprintf(Msg,"Can not read system tablespace 4 to do 
bootstrap[$s],errno[$d]",FileName,errno); 
printTraceMsg('F',-99,Msg); 
exit(-1); 
) 
/ /映射 块头 到 bh 
bh=(ktbbh *)&(BlockBuffer[20]); 
// 调 用 unloadBlock 函数 从 一 个 数据 块 中 读 取 数据 
Ret=unloadBlock(fp,fpDel, ParameterList.db_block_size, &TypeList,bh->ktbbhsid, 
&ClusterTypeList,0); 
// 以 下 是 重复 的 ， 读 取 下 一 个 bootstrapS$ 块 。 老 白 为 了 图 省 事 ， 对 于 bootstrapS$ 表 没有 从 段 头 读 取 Extent 
/ /Map， 然 后 通过 Extent Map 来 找 数据 块 。 实 际 上 bootstrap$ 的 内 容 也 不 会 很 多 ， 所 以 就 偷懒 了 。 如 果 大 家 写 
//Dul, 千 万 不 要 这 么 偷懒 









































if(lseek(fvp,ParameterList.db block size* (BLOCK_ID(BootStrapDba)+1),SEEK_SET)<0) 
t 
sprintf(Msg,"Can not lseek system tablespace 3 to do 
bootstrap[$s],errno[$d]",FileName,errno); 
printTraceMsg('F',-99,Msg); 
exit(-1); 


if(read(fvp,BlockBuffer,ParameterList.db block size)<=0) 
{ 
sprintf (Msg, "Can not read system tablespace 5 to do 
bootstrap [%s],errno[%d]",FileName,errno) ; 
printTraceMsg('F',-99,Msg); 
exit(-1); 
} 
Ret+=unloadBlock(fp,fpDel, ParameterList.db_block_size, &TypeList,bh->ktbbhsid, 
&ClusterTypeList,0); 
. ix H NR f n 个 类 似 的 unload 
fclose(fp); 
Ret-readObj(); 
if (Ret<=0) 
{ 
sprintf (Msg, "Can not get Obj$ information ,load failed"); 
printTraceMsg('F',-99,Msg); 
exit(-1); 





Hé 优化 | 由 技巧 ) unloadBlock 函数 

”上 一 节 老 白 没有 介绍 unloadBlock 函数 ， 而 这 个 函数 才 是 大 家 关心 的 焦点 ， 因 此 本 节 将 详 
细 介 绍 这 个 函数 。 老 白 终究 是 10 年 没有 写 过 C 程序 了 ， 程 序 的 结构 确实 有 点 惨不忍睹 ， 不 过 意 
思 到 了 就 行 了 。 大 家 记 住 是 跟着 老 白 学 写 dul 而 不 是 跟着 老 白 学 写 C 程序 。 


int unloadBlock(FILE *fp,FILE* fpDel,int BlockSize,colStruc *TypeList,int 
DataObjectId,colStruc *ClusterTypeList,int TabIndex) 
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f k k k k k k k k k k k k k k k k k k k k k k k k k k k k k k KKK KK KK KK KK KK KKK ck R OR R R R ck kck ck ck R R ck ck R OR ck R R ck k / 
*fp :存储 下 载 数 据 的 文件 指针 

*fpDel :存储 删除 行 的 文件 指针 

*BlockSize: 数 据 块 的 大 小 

*TypeList :字段 列表 
*DataObjectid: 数据 存储 的 Dataobj 值 ， 我 们 扫描 数据 文件 时 只 下 载 ID 相同 的 
*ClusterTypeList: MTIR TRIIR ERETRIA 

*TabIndex; (E#RA PWS, EAE. Wi 0 


* 




















He RR ck ck ck ck ck ck ck ck RRR k ck ck ck ck ck ck ck ckckckokckckckckck ck ck ck ck ck ck ck ck KKK RK RK ok ck ck kk ek J 


{ 
int itls; 
kcbh *bh; 
kdbt *dbt1,*dbt2,*dbt; 
ub2 *pt; 
int BaseLine; 
char Msg[80]; 
int i,j,k; 
ktbbh *bh1; 
kdbh *dbh; 
int Rows; 
int PreRows; 
unsigned char *RowPt; 
bh= (kcbh*)&(BlockBuffer[0]); 
Rows=0; 
// 如 果 类 型 不 是 6， 就 不 需要 下 载 了 ， 因 为 不 是 数据 块 
if (bh->type_kcbh==6) 
{ 
bhi=(ktbbh *) &(BlockBuffer[20]); 
BhiInfo-*bh; 
BhDetail-*bh1; 
/ /如 果 数 据 块 里 的 dataobj 和 我 们 下 载 的 不 一 致 ， 就 不 需要 下 载 了 ， 因 为 出 错 了 
if (bhl->ktbbhsid==DataObjectId) 
t 














CurrentRdba=bh->rdba_kcbh; 

sprintf (Msg, "Find a data block [0x%x] (%d/%d)",bh->rdba_kcbh, 
FILE ID(bh-»rdba kcbh),BLOCK, ID(bh-»rdba kcbh)); 
// printTraceMsg('I',0,Msg); 
// È ITL 的 数量 

itls=bh1->ktbbhict&0x00ff; 
// 判 断 是 不 是 ASSM 的 ， 如 果 是 ASSM HJ, BASELINE 要 比 普 通 的 多 8 个 字 节 

if (bh1->ktbbhflg &0x10) 

BaseLine=52; 
else BaseLine=44; 


// 取 kdbt 结构 的 地 址 ， 里 面 存储 了 每 一 行 的 位 置 





dbt1=(kdbt*) & (BlockBuffer [BaseLine+14+itls*24]); 
// 取 kdbh 结构 的 地 址 ， 里 面 有 关键 的 行 数 这 个 字段 
dbh= (kdbh*)&(BlockBuffer[BaseLine+itls*24]); 
/ /如果 kdbhntab 大 于 1， 说 明 这 个 块 里 包含 的 表 的 数量 大 于 1， 即 这 是 一 个 徐 
if (dbh->kdbhntab>1) 
CLUSTER_TBL=true; 




















CLUSTER_TBL=false; 
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if (CLUSTER_TBL==false) { 
// 根 据 kdpbt 的 结构 找到 每 一 行 的 地 址 ， 下 载 数据 
for (i=0;i<dbt1->kdbtnrow; i++) 
{ 
CurrentRowNo=i; 
pt-(ub2*) &( BlockBuffer [BaseLine+14+4*dbh -> kdbhntab +itls*24+2*i]); 
// 某 一 行 的 指针 被 取 到 RowPt 里 
RowPt=& (BlockBuffer[*pt+BaseLinetitls*24]); 
RowPoint=*pt; 





/ /下 载 一 行 数据 


Rows+=unloadRow(fp, fpDel, RowPt, TypeList,i); 


} 


else 
{ 
[LR AE. HCE PARU E gë 


unloadClusterKey (BlockSize,ClusterTypeList, dbh->kdbhntab, dbh, dbt1,BaseLine,itls) ; 
dbt=dbt1; 
PreRows=0; 


dbt2=(kdbt*) & (BlockBuffer [BaseLine+14+itls*24+4*TabIndex] ) ; 


for (i=dbt2->kdbtoffs;i<dbt2->kdbtoffs+dbt2->kdbtnrow; i++) 
{ 
pt=(ub2*) &(BlockBuffer [BaseLine+14+4*dbh->kdbhntab+itls*24+2*i]); 
CurrentRowNo-i; 
RowPt-&(BlockBuffer[*pt-«BaseLine-itls*24]); 
RowPoint=*pt+BaseLine+itls*24; 
RowPointi-*pt; 


Rows--unloadClusterRow(fp,fpDel,RowPt,TypeList,i); 


return Rows; 
) 
else 
( 


return 0; 


) 
else 
return 0; 


E- 优化 山 技巧 ) unloadRow 函数 


Y 


在 上 一 小 节 里 已 经 从 数据 块 计算 出 每 一 行 的 位 置 ， 然 后 通过 unloadRow 去 下 载 一 行 数据 。 


在 这 一 节 里 ， 老 白 要 把 压 箱底 的 unloadRow 拿 出 来 和 大 家 分 享 了 ， 该 函数 的 代码 如 下 : 
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int unloadRow(FILE* fp,FILE*fpDel,char * RowPt,colStruc * TypeList,int RowNum) 
{ 
char Msg[80]; 
int i; 
char *pt; 
ub2 Length; 
ub2* Length2; 
ubl Length1; 
kdrh * RowHd; 
ubl itls; 
unsigned char buffer[65532]; 
char ColBuffer[4000]; 
RowHd=(kdrh *)RowPt; 
RowBuffer[0]='\0'; 
CurrentRow-RowPt; 





























// 如 果 行 的 第 一 个 字 节 为 0， 那么 这 一 行 没 有 数据 ， 直 接 返 巨 
if (RowPt [0]==0) 
return 0; 

// 


if ( (RowPt[0]&0x10) !=0) 


{ 
// 第 一 个 字 节 为 0x3c 说 明 是 删除 的 记录 
if (RowPt [0]==0x3c) 
{ 
itls=(ubl ) RowPt[1]; 
if (itls>(BhDetail.ktbbhict&0x00ff)) 
{ 
fprintf(stderr,"bad row\n"); 
return 0; 


pt=RowPt+3; 
for (i=0; i<RowHd->kdrhcecnt; i++) 
{ 
Length1- (ub1)pt[0]; 
if(Length1--0xff) 


{ 
if (i==0) 
strcat (RowBuffer,"N"N""); 
else 
strcat (RowBuffer,",\"\""); 
pt**; 
continue; 
} 
if (Length1!=0xfe) 
{ 
Length-Lengthl; 
pt**; 
H 
else 
{ 


Length2=(ub2*)&(pt[1]); 
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Length-*Length2; 
pt=pt+3; 
} 
memcpy (buffer,pt,Length) ; 
buffer [Length]; 
if (i==0) 
{ 


strcat (RowBuffer,"\""); 


strcat (RowBuffer,parseData (buffer,Length,TypeList->ColType[i+1])); 
if (ParseSuc==0) return 0; 
strcat (RowBuffer,"\""); 


} 


else 


{ 


strcat (RowBuffer,",\""); 


strcpy (RowBuffer,parseData (buffer, Length, TypeList->ColType[it+1])); 
if (ParseSuc==0) return 0; 


strcat (RowBuffer,"\""); 
} 
pt=pt+Length; 
} 
fprintf(fpDel,"%s\n",RowBuffer) ; 
} 
else{ 


} 


return 0; 


J 
// 正 常 的 记录 是 从 0x2c 开头 的 
if((RowPt[0]!-0x2c)) 





return 0; 
if ( (RowPt [0]&0x20) ==0) 
{ 
return 0; 
} 
if ( (RowPt [0] &&0x03) !=0) 
{ 
return 0; 
H 
if (RowPt [0] !=0) 
exit(-1); 


} 
// 通 过 itls 指针 来 判断 这 一 行 是 否 是 有 效 行 ，it1s 必须 小 于 等 于 itc 的 值 
itls-(ub1 ) RowPt[1]; 
if (itls»(BhDetail.ktbbhict&0x00ff)) 
{ 
fprintf(stderr, "bad row\n") ; 
return 0; 


if (RowPt [0] ==0x2c) 


5H28H BBED 的 妙用 157 





pt=RowPt+3; 
else 
pt=RowPt+9; 
for (i=0; i<RowHd->kdrhccnt; i++) 
{ 
// 每 个 字段 的 第 一 个 字 节 表示 列 长 度 ， 如 果 是 FE， 那 么 说 明 行 长 度 大 于 254 
// 需 要 使 用 3 个 字 节 来 表示 列 长 度 
/ /如 果 是 FFE， 说 明 该 记录 已 经 迁移 了 ， 不 在 原来 的 位 置 
Length1=(ub1)pt[0]; 
if (Length1==0xff) 
{ 
if (i==0) 
strcat (RowBuffer,"\"\""); 
else 
strcat (RowBuffer,",\"\""); 





pttt+; 
continue; 


} 


if (Length1!=0xfe) 
( 
Length-Length1; 
pt++; 
) 


else 
t 
Length2=(ub2*)&(pt[1]); 
Length=*Length2; 
pt=pt+3; 


} 
// 将 这 个 列 的 值 复制 到 buffez 里 
memcpy (bu£fer,pt,Length); 
buffer [Length] =0; 
// 通 过 ParseData 函数 将 内 部 格式 转 为 字符 串 类 型 ， 写 入 文件 中 
if (i==0) 
{ 
strcat(RowBuffer,"N""); 
strcat (RowBuffer,parseData (buffer, Length, TypeList->ColType[i+1])); 
strcat (RowBuffer,"\""); 





else 
{ 
strcat (RowBuffer,",\""); 
strcat (RowBuffer, parseData (buffer, Length, TypeList->ColType[i+1])); 
strcat (RowBuffer,"\""); 
} 
pt=pt+Length; 
} 
fprintf(fp,"%s\n",RowBuffer) ; 
return 1; 


} 
至 此 老 白 介绍 的 dul 编写 告 一 段落 。 老 白 只 是 为 大 家 领 了 一 段 路 ， 而 真正 要 写 出 一 个 十 分 优 
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秀 的 dul 工具 ， 绝 对 是 要 花费 很 多 精力 的 。 更 多 的 经 验 ， 问 问 dc.b.a 可 能 收获 会 更 大 。 

这 里 没有 介绍 的 内 容 还 有 很 多 ， 比 如 Extent Map 分 析 。 因 为 我 们 要 下 载 一 张 表 ， 首 先 必须 
找到 段 头 ， 然 后 找到 段 头 里 的 Extent Map, ， 将 这 张 表 中 所 有 高 水 位 以 下 的 扩展 统统 找 出 来 ， 然 后 
一 个 块 一 个 块 地 下 载 下 来 。 

另外 关于 字段 内 部 格式 的 转换 ， 在 DSI 401E 里 面 有 很 详细 的 介绍 ， 我 这 里 也 就 不 做 过 多 解 
释 了 。 





{À 
\_A 
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周 六 的 会 议 没有 达到 我 们 预期 的 效果 , CACHER eI €, 不 过 这 样 的 结果 预先 也 曾 考 虑 到 了 ， 
在 这 种 情况 下 只 能 接受 。 坤 外 损失 坤 内 补 , 开发 商 带 来 的 负面 影响 只 能 用 我 们 更 加 细致 的 准备 来 
弥补 了 。 因 此 , 今天 开始 的 工作 将 是 十 分 关键 的 ， 我们 将 要 把 前 几 天 提出 的 纲要 性 的 东西 变 成 一 
系列 可 操作 的 文字 和 脚本 , 也 许 这 个 项 目的 优化 效果 可 能 取决 于 这 几 天 的 工作 。 这 也 等 于 整个 项 
目 周 期 的 提前 , 如 果 6 月 6 日 的 优化 能 够 解决 80% 的 性 能 问题 , 那么 后 续 这 段 时 间 只 要 针对 SQL 
进行 优化 ， 就 可 以 实现 优化 目标 了 。 

大 家 决定 除了 老 熊 继续 做 SQL 优化 外 ， 其 他 人 都 投入 到 优化 方案 细 化 的 工作 中 。 而 老 能 近 
期 的 重点 除了 基于 索引 的 SQL 优化 之 外 ， 还 要 继续 和 开发 商 扯皮 ， 和 他 们 一 起 尽快 找 出 优化 那 
个 12 张 表 关 联 查询 的 优化 方案 。 

用 户 的 服务 器 是 IBM P650， 操 作 系统 是 AIX 5.2。 对 于 操作 系统 方面 的 调整 ， 主 要 通过 
vmtune 调整 maxperms 和 maxclients。 另 外 ，pbuf 略 微 不 足 ， 也 需要 加 。 在 最 初 的 时 候 ， 
我 们 也 考虑 过 把 操作 系统 升级 到 AIX 5.3。 因 为 AIX 5.3 在 性 能 上 比 AIX 5.2 要 好 很 多 , 但 是 从 
安全 考虑 ， 我 们 暂时 不 考虑 升级 操作 系统 ， 而 仅 在 操作 系统 层面 上 进行 优化 。 

存储 方面 的 问题 也 较 多 ， 不 过 由 于 存储 升级 的 可 能 性 几乎 为 0， 所 以 优化 存储 的 基础 也 不 存 

在 ， 只 能 通过 减少 IO 的 数量 来 改进 存储 的 总 体 性 能 了 。 开 始 时 考虑 过 把 在 线 重 做 日 志文 件 独立 
出 去 的 问题 ,但 由 于 存储 已 经 插 满 了 ， 无 法 扩充 硬盘 而 无 法 实施 。 
在 数据 库 方面 , 除了 需要 加 大 数据 库 缓 冲 池 、 共 享 池 、 日 志 缓 冲 区 以 外 , 重 做 日 记 文件 太 小 ， 
需要 从 100MB 加 大 为 500MB, ， 同 时 每 个 实例 增加 几 组 重 做 日 志 组 ， 使 每 个 实例 的 重 做 日 志 组 的 
数量 达到 8 组 ,对 于 共享 池 , 决 定 启用 session cached cursors 参数 ,同时 将 cursor sharing 
从 exact 修改 为 similar。 

对 于 数据 库 对 象 方面 的 调整 , 主要 集中 在 一 些 大 表 的 分 区 上 , 三 套 系统 各 有 五 六 张大 表 需 要 
调整 。 在 这 些 表 中 ， 最 大 的 表 有 近 80GB ， 最 小 的 也 有 几 吉 字 节 。 表 分 区 的 原则 ， 已 经 几 次 征求 
开发 商 的 意见 ， 他 们 都 不 肯 提 出 自己 的 建议 ， 而 让 我 们 自己 决定 ,因此 分 区 主键 的 选择 完全 依赖 
于 技术 分 析 ， 而 设 有 一 点 业务 方面 的 支持 。 

我 们 进行 分 区 主键 选择 的 方法 是 将 和 该 表 相 关 的 主要 SQL 全 部 找 出 来 ， 根 据 逻 辑 读 和 物理 
读 排序 ， 从 这 些 SQL 的 WHERE 条 件 以 及 表 连 接 条 件 中 查找 效率 最 高 的 分 区 主键 。 这 种 方法 说 起 
来 容易 , 实现 起 来 往往 比较 困难 , 因为 很 多 表 的 分 区 主键 并 不 是 那么 明显 , 仅仅 从 SQL 的 WHERE 
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条 件 很 难 做 出 十 分 准确 的 定位 。 在 以 往 我 们 做 过 的 优化 项 目 中 , 分 区 主键 的 确定 一 般 都 是 我 们 和 
开发 商 一 起 协商 的 。 不 过 值得 庆幸 的 是 ， 通 过 SQL 分 析 发 现 ， 这 些 表 都 有 十 分 典型 的 分 区 主键 。 
老 肖 马 上 着 手 建立 评估 模型 ,初步 评估 几 张 超大 表 。 按 照 我 们 确定 的 分 区 主键 进行 分 区 后 , 绝 大 
多 数 Top SQL 的 性 能 都 得 到 了 不 同 程度 的 提升 ， 对 该 表 的 扫描 性 能 也 可 以 有 大 幅度 的 提升 。 

单 表 重 定义 为 分 区 表 的 实施 方法 有 很 多 种 ,通过 在 线 重 定义 、 导 出 导入 等 都 是 可 行 的 。 某 些 
对 于 停机 窗口 要 求 很 严 的 系统 , 必须 使 用 在 线 重 定义 的 方法 来 实施 , 但 是 Oracle 自身 的 在 线 重 定 
义 存 在 一 定 的 风险 。 对 于 几 十 个 吉 字 节 的 表 ， 我 们 一 般 不 太 采 用 。 目 前 也 有 一 些 第 三 方 产品 支持 
表 的 在 线 重 定 义 ， 这 些 工 具 一 般 来 说 先 通过 一 个 查询 将 表 中 的 数据 复制 到 一 个 地 方 , 然后 从 重 做 
日 志 中 控 取 与 这 个 表 相 关 的 变化 ,并 将 其 更 改 到 目标 表 中 ， 最 后 用 很 短 的 时 间 切 断 源 表 ， 并 将 最 
终 的 变化 更 改 到 目标 表 。 这 种 机 制 可 以 做 到 最 小 的 停机 时 间 ， 不 过 这 种 工具 往往 十 分 昂贵 。 

我 们 比较 幸运 ， 由 于 分 区 表 的 数量 不 多 , 并且 停 机 窗口 允许 ,所 以 建议 客户 采用 最 为 稳妥 的 
方法 。 首 先 将 原来 的 表 重 命名 , 然后 创建 一 个 新 的 表 (分 区 表 ), 然后 使 用 INSERT /*+ APPEND*/ 
的 方式 导入 数据 ， 然 后 再 创建 索引 。 这 种 方式 一 旦 出 现 问题 ， 回 退 起 来 十 分 快捷 ， 只 要 做 一 个 重 
命名 就 可 以 了 。 表 重建 后 ， 可 以 等 业务 系统 跑 上 一 段 时 间 ， 确 定 设 有 问题 后 ， 再 删除 旧 表 。 

由 于 客户 的 系统 内 存 十 分 有 限 , 所 以 为 了 提高 DB Cache 的 效率 , 启用 keep 池 是 十 分 必要 的 。 
不 过 使 用 keep 池 也 磁 到 了 一 个 难题 ， 由 于 开发 商 不 愿意 提供 热 表 ， 所 以 所 有 的 热 表 和 热 索 引 都 
必须 自己 查找 。 一 般 来 说 ， 热 表 应 该 从 业务 角度 来 定义 ,开发 商 提供 的 热 表 才 是 最 准确 的 ， 但 是 
在 目前 这 种 情况 下 ， 只 能 通过 分 析 xsph 来 获取 热 表 。Oracle 8i 引 入 了 touch 这 个 统计 数据 块 热 
度 的 计数 器 。 我 们 通过 统计 xsbh 中 某 个 对 象 的 TCH 值 ， 找 出 那些 TCH 统计 值 很 高 并 且 较 小 的 
对 象 ， 作 为 放 入 keep 池 的 候选 对 象 。 这 个 查找 工作 十 分 艰苦 ， 因 为 DB Cache 在 不 断 变 化 ， 所 以 
需要 采集 不 同时 间 段 的 多 个 采样 ， 然 后 从 采样 中 进行 分 拣 ， 最 终 找 到 适合 放 入 keep 池 的 对 象 。 
一 般 的 观点 是 放 入 keep 池 的 应 该 是 一 些 基 本 静态 的 小 表 。 因 为 如 果 访 问 量 十 分 大 ， 放 入 keep ith 
会 十 分 合适 ， 不 过 并 不 是 只 有 静态 的 小 表 才 适合 放 入 keep il, keep 池 的 作用 是 提高 DB Cache 
的 使 用 效率 ， 减 少 buffer busy waits, ， 同 时 也 能 有 效 地 减少 cache buffers chains FAM A AEH, 
具体 哪些 对 象 可 以 放 和 keep 池 并 不 是 十 分 严格 , 原则 上 , 热 的 对 象 ( 表 和 索引 ) 都 适合 放 入 keep 
池 ， 而 并 不 一 定 要 求 是 要 静态 的 (当然 静态 的 表 放 入 keep 池 是 最 佳 的 )。 由 于 keep 池 的 大 小 有 
限 ， 所 以 放 入 keep 池 的 对 象 要 进行 十 分 严格 的 盘 选 。 并 且 不 能 把 过 多 的 对 象 放 入 keep 池 ， 因 为 
keep 池 中 的 对 象 都 是 十 分 热 的 ， 所 以 keep 池 出 现 拌 动 或 者 出 现 轻 微 的 不 命中 ， 都 会 较 大 地 影响 
系统 的 性 能 。 至 于 放 入 keep 池 的 对 象 的 大 小 ， 也 不 能 一 刀 切 地 进行 划 界 。 有 些 几 百 兆 字 节 甚至 
更 大 的 表 ， 如 果 访 问 十 分 频繁 ， 需 要 长 期 驻 留 内 存 ， 放 入 keep 池 也 不 是 不 可 以 。 

查找 放 入 keep 池 对 和 象 的 工作 原本 有 老 肖 在 做 ， 他 也 已 经 列 出 了 一 个 清单 。 今 天 我 和 老 肖 一 
起 讨论 了 一 下 ,发 现 这 么 做 还 是 有 一 些 问 题 , 最 好 能 够 结合 系统 的 特点 来 查找 ,否则 只 是 通过 热 
度 来 查找 工作 量 太 大 。 我 以 前 开发 过 计 费 账 务 系统 ， 对 电信 的 业务 比较 熟悉 。 电 信和 总 局 的 第 一 代 
计 费 账 务 系统 的 数据 字典 那 本 厚 厚 的 灰 皮 书 当时 被 我 翻 了 无 数 遍 ， 那 些 ACCT, SERV, CUST 
之 类 的 表 , 我 是 一 辈子 都 不 会 忘记 的 。 想 当年 我 们 7 个 人 居然 能 够 开发 出 一 套 符合 电信 总 局 规范 
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的 账 务 系统 , 并 且 通 过 了 电信 和 总 局 的 软件 测试 。 现 在 , 一 个 账 务 系统 动不动 就 需要 上 百人 来 开发 ， 
真是 不 可 想象 。 和 老 肖 商量 了 一 下 ， 他 继续 通过 脚本 查找 热 表 ， 查 到 的 热 表 清单 提交 给 我 ， 由 我 
根据 业务 特点 进行 筛选 。 在 筛选 过 程 中 , 我 还 可 以 通过 开发 商 的 现场 项 目 经 理 小 王 进行 确认 。 
为 通过 最 近 这 段 时 间 的 合作 ， 我 们 也 帮 了 小 王 几 次 忙 ， 所 以 我 们 之 间 的 沟通 渠道 已 经 比较 畅通 。 

查找 热 块 的 方法 其 实 很 简单 : 通过 vSbh 视图 就 可 以 定位 。 自 从 Oracle 8 引入 了 TCH 这 个 统 
计 项 以 后 ， 查 找 热 块 的 工作 变 得 简单 起 来 ， 而 不 用 像 以 前 那样 去 转 储 LRU 链 的 信息 。 首 先 通过 
下 面 的 脚本 获取 TCH 比较 高 的 对 象 : 


Select decode(pd.bp id,1,'KEEP',2,'RECYCLE',3,' 'DEFAULT',4, 
'2K SUBCACHE', 5,'4K SUBCACHE',6,'8K SUBCACHE',7, 
'16K SUBCACHE',8,'32K SUBCACHE','UNKNOWN') subcache, 
bh.object name object name,bh.blocks,tch 
from x$kcbwds ds, x$kcbwbpd pd, 
(SELECT /*+ use hash(x) */ set ds, 
o.name object name, count(*) BLOCKS,sum(tch) tch 
FROM obj$ o, x$bh x 
WHERE o.dataobj# = x.obj 
AND x.state !=0 and o.owner# !=0 
GROUP BY set ds,o.name) bh 
WHERE ds.set id »- pd.bp lo sid 
AND ds.set id «- pd.bp hi sid 
AND pd.bp size !- 0 
AND ds.addr-zbh.set ds 
AND TCH>2000 
ORDER BY subcache,object name; 




















SUBCACHE OBJECT NAME BLOCKS TCH 
DEFAULT ACCT ITEM AGGR 10611 30 2742 
DEFAULT ACCT ITEM AGGR 10611 28 2754 


类 似 上 面 的 ACCT TTEM AGGR 10611 就 可 能 是 放 入 keep 池 的 候选 对 象 。 不 过 并 不 是 查 出 来 的 对 
象 都 是 应 该 放 入 keep thi], ACCT_ITEM_AGGR_10611 表 接 近 800MB ， 因 此 该 表 不 适合 放 入 keep ith, 

这 个 工作 十 分 枯燥 ,还 好 老 肖 很 有 耐性 ,他 交 给 我 的 清单 上 面 列 出 了 详细 的 信息 ,哪怕 是 已 
经 被 初步 认为 不 适合 放 入 keep 池 的 对 象 ， 也 只 是 在 上 面 做 了 注释 ， 而 没有 简单 地 删除 。 


PSREN) 查找 “ 热 的 ”缓冲 区 的 常用 脚本 


优化 热 块 是 每 个 优化 项 目 都 会 遇 到 的 问题 。 实 际 上 在 无 法 得 到 开发 部 门 足够 的 支持 下 , ET 
只 能 通过 分 析 数 据 库 缓 冲 区 获得 第 一 手 资料 。 从 Oracle 8i 开始 ，Oracle 修改 了 热 块 的 处 理 算法 ， 
引入 了 tch 这 个 统计 值 , 在 x$bh 中 可 以 根据 tch 来 判断 该 数据 块 是 否 为 热 块 。 下 面 几 个 脚本 就 
是 十 分 有 用 的 通过 数据 缓冲 区 获得 热 块 信息 的 脚本 (要 注意 的 是 ， 由 于 数据 块 在 DB Cache 中 是 
动态 的 ， 所 以 以 x$bh 中 只 能 获得 一 些 热 块 的 线索 ， 并 不 能 十 分 准确 地 定位 热 块 ， 最 好 的 定位 热 
块 的 方法 还 是 通过 业务 角度 分 析 为 好 ): 


SELECT decode(pd.bp id,1,'KEEP',2,'RECYCLE',3, 'DEFAULT',4, 
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'2K SUBCACHE', 5,'4K SUBCACHE',6,'8K SUBCACHE',7, 
'16K SUBCACHE',8,'32K SUBCACHE','UNKNOWN') subcache, 
bh.object name object name,bh.blocks,tch 
FROM x$kcbwds ds, x$kcbwbpd pd, 
(SELECT /*+ use hash(x) */ set ds, 
o.name object name, count(*) BLOCKS,sum(tch) 七 ch 
FROM obj$ o, x$bh x 
WHERE o.dataobj# = x.obj 
AND x.state !=0 and o.owner# !=0 
GROUP BY set ds,o.name) bh 
WHERE ds.set id »- pd.bp lo sid 
AND ds.set id «- pd.bp hi sid 
AND pd.bp size !- 0 
AND ds.addr-bh.set ds 
AND TCH>2000 
ORDER BY subcache,object name; 


SQL> column cl heading "Object |Name" format a30 truncate 
SQL> column c2 heading "Object |Type" format a12 truncate 
SQL> column c3 heading "Number of|Blocks" format 999,999,999,999 





SQL> column c4 heading "Percentage|of object|data blocks|in Buffer" format 999 


SOL» break on report 
SOL» compute sum of c3 on report 
SQL> spool dbcache.lst; 





SELECT 
object name el, 
object_type CA, 
num blocks e3, 
(num blocks/decode(sum(blocks), 0, .001, sum(blocks)))*100 c4 
FROM 
(SELECT 
o.object name object name, 
o.object type object type, 
count (1) num blocks 
FROM 
dba objects o, 
VSbh bh 
WHERE 
o.object id = bh.objd 
AND 
o.owner not in ('SYS','SYSTEM') 
GROUP BY 


o.object name, 
o.object type 
ORDER BY 
count(1) desc 
) ti, 
dba, segments s 
WHERE 
S.segment name = tí1.object name 
AND 
num blocks » 10 
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GROUP BY 
object name, 
object type, 
num blocks 
ORDER BY 
num blocks desc 




















Percentage 
of object 
Object Object Number of data blocks 
Name Type Blocks in Buffer 
CALL EVENT 10604 TABLE 709 0 
VALUE ADDED OTHER EVENT 10610 TABLE 705 0 
CALL EVENT 10603 TABLE 691 0 
VALUE ADDED OTHER EVENT 10605 TABLE 682 0 
CALL EVENT 10610 TABLE 675 0 
CALL EVENT 10606 TABLE 672 0 
CALL EVENT 10601 TABLE 621 0 
CALL EVENT 10602 TABLE 572 0 
第 二 个 脚本 分 析 第 一 个 脚本 找到 的 热 块 ， 看 看 它们 在 DB Cache 中 有 多 少 ， 并 且 平时 有 多 大 
比例 的 数据 块 在 缓冲 区 中 。 通 过 这 两 个 脚本 ， 就 可 以 初步 定位 可 能 放 入 keep 池 中 的 对 象 了 。 不 


过 最 准确 地 确定 keep 对 象 还 是 从 业务 角度 。 技 术 分 析 是 最 后 的 办 法 ， 而 不 是 推荐 的 方法 。 


E" flam) 什么 时 候 需要 使 用 多 缓冲 
“并 不 是 在 任何 场合 都 需要 使 用 多 缓冲 池 。 通 过 对 系统 VO 性 能 的 评估 来 确定 是 否 使 用 多 缓冲 
池 是 比较 科学 的 方法 。 分 配 多 缓冲 池 的 原则 是 把 经 常 使 用 的 小 型 对 象 ( 比 如 参照 表 、 常 用 的 索引 
TE) 放 入 keep 池 中 ， 把 随机 访问 的 大 型 表 放 入 recycle 地 中 。 下 面 的 步骤 可 以 定位 某 个 对 象 占用 
缓冲 池 的 大 小 。 

(1) 找 出 对 象 的 内 部 ID， 具 体 代 码 如 下 : 


SELECT data object id, object type 
FROM user objects 

WHERE object name = '<segment_name>' 

AND object type-'«object type»'; 


(2) 找 出 该 对 象 占 用 的 缓冲 区 的 大 小 ， 具 体 代 码 如 下 : 


SELECT count(*) buffers 
FROM xSbh 
WHERE obj = <data_object_id>; 


需要 注意 的 是 ， 上 面 的 脚本 可 以 查找 非 分 区 的 对 象 。 对 于 分 区 对 象 ， 需要 将 所 有 分 区 的 缓冲 
区 大 小 累加 。 

(3) 查询 出 系统 的 缓冲 区 的 总 数 。 

对 于 早期 的 版 本 ， 如 果 使 用 db block buffers 参数 ， 可 以 使 用 下 面 的 查询 : 


SELECT value "total buffers" 
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FROM v$parameter 
WHERE name - 'db block buffers'; 


对 于 Oracle 9i 数 据 库 ， 可 以 使 用 如 下 的 查询 : 


SELECT name,VALUE/«DB BLOCK SIZE» "TOTAL BUFFERS" 

FROM VSPARAMETER 

WHERE NAME IN 

("db cache size','db keep cache size','db recycle cache size'); 


其 中 <DB_BLOCK_STZE> 是 数据 库 默 认 块 大 小 。 
计算 占用 率 的 公式 如 下 : 
占用 率 =buffers (第 (2) 步 ) /total buffers (第 (3) 步 ) 

应 该 把 哪些 对 象 放 入 哪个 缓冲 池 中 是 一 个 十 分 复杂 的 问题 。 对 于 一 个 对 象 来 说 ,如 果 块 获取 
接近 于 物理 读 ， 那 么 说 明 该 对 象 中 的 数据 基本 上 不 重用 ， 因 此 可 以 把 该 对 象 放 入 recycle 池 中 。 
上 面 的 例子 虽然 看 起 来 很 简单 ， 但 在 实际 应 用 中 又 不 是 那么 简单 。 由 于 应 用 系统 的 复杂 性 ， 对 某 
张 表 的 访问 方式 可 能 是 多 样 性 的 ， 有 基于 索引 的 扫描 ， 也 可 能 存在 全 表 扫 描 或 者 区 域 扫 描 (比如 
统计 和 模糊 查询 )， 简 单 地 区 分 是 否 可 以 把 某 个 表 放 入 recycle 池 的 方法 是 不 存在 的 。 另 外 ， 什 么 
样 的 对 象 是 小 的 可 以 放 入 keep 池 的 对 象 ， 这 个 问题 同样 复杂 。 有 一 些 Oracle 技术 资料 认为 100 
块 以 下 的 对 象 可 以 认为 是 小 的 对 象 , 也 有 资料 说 500 块 以 下 的 对 象 可 以 称 为 小 对 象 ， 其 实在 实际 
的 应 用 中 并 不 能 仅仅 从 对 象 的 大 小 来 进行 区 分 。 在 实际 应 用 中 , 各 种 环境 下 缓冲 池 的 大 小 是 不 同 
的 。 对 于 一 个 部 门 级 环境 来 说 ， 数 据 库 缓冲 区 总 的 大 小 可 能 只 有 300MB ， 而 对 于 一 个 大 型 的 企 
业 级 环境 来 说 ， 可 能 会 有 几 十 吉 字 节 的 缓冲 池 ， 因 此 根据 应 用 的 情况 来 确定 使 用 哪 种 缓冲 了 地 是 比 
较 科 学 的 方法 。 下 面 是 一 些 多 缓冲 池 使 用 的 经 验 (注意 ， 只 是 经 验 ， 并 不 是 原则 )。 

O 使 用 多 缓冲 池 肯 定 对 系统 的 IO 优化 会 有 所 帮助 。 
a 在 进行 数据 库 设 计时 , 不 光 要 考虑 表 在 缓冲 池 中 的 配置 , 也 要 考虑 索引 在 缓冲 池 中 的 配置 。 
O 对 于 分 区 的 对 象 ， 可 以 按照 单个 分 区 来 考虑 ， 同 一 个 对 象 的 不 同 分 区 可 能 需要 放 到 不 同 
































的 缓冲 区 中 。 

a 变动 比较 小 的 、 经 常 访问 的 小 型 对 象 (记录 数 1000 行 或 几 千 行 )， 不 添加 索引 ， 直 接 放 
A keep 池 中 。 

a 小 于 default il, 10% 大 小 的 ， 至 少 引 起 1% 物 理 IO 的 对 象 ， 可 以 考虑 放 入 keep ith. 


L 


对 于 在 缓冲 区 中 的 块 数 超过 75% 的 对 象 ， 如 果 keep 池 足 够 ， 可 以 考虑 将 该 对 象 放 入 keep 
池 中 。 

对 于 使 用 率 十 分 高 的 索引 ， 如 果 keep 池 容 量 充足 ， 可 以 放 到 keep 池 中 。 

大 型 的 经 常 做 随机 访问 的 表 可 以 放 到 recycle 池 中 。 

可 以 适当 使 用 非 默认 块 大 小 的 表 空 间 (Oracle 9i 以上) 。 


E - MIENI) AIX 操作 系统 优化 要 点 
一 般 来 说 ，AIX 操作 系统 针对 Oracle 数据 库 的 优化 并 不 复杂 ， 主 要 集中 在 异步 JO、 虚 拟 内 
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存 管理 等 方面 。 对 于 异步 /O， 首 先 要 明白 一 点 ， 针 对 裸 设备 和 针对 文件 系统 的 优化 是 不 同 的 。 
AIX SL 对 于 裸 设备 使 用 异步 VO 是 内 核 支持 的 ， 因此 不 需要 使 用 AIO Server, 而 文件 系统 使 用 异 
步 VO 时 ， 则 需要 使 用 AIO Server。 通 过 以 下 命令 可 以 检查 异步 IO 的 设置 : 





LN-BILL-DB-JF || / # lsattr -El aio0 

autoconfig available STATE to be configured at system restart True 
fastpath enable State of fast path True 
kprocprio 39 Server PRIORITY True 
maxreqs 4096 Maximum number of REQUESTS True 
maxservers 40 MAXIMUM number of servers per cpu True 
minservers 10 MINIMUM number of servers True 


maxreqs 是 最 大 AIO 请 求 数量 ， 其 默认 值 是 4096， 对 于 较 大 的 系统 来 说 ，4096 可 能 不 够 。 
由 于 Oracle FH AIX BJ bug, “4 maxregs 不 足 时 会 出 现 类 似 下 面 的 错误 : 


Sun Dec 16 21:27:34 2007 

Errors in file /datal/oracle9/app/admin/sdh/bdump/sdh dbw3 462948.trc: 
ORA-27061: skgfospo: waiting for async I/Os failed 

IBM AIX RISC System/6000 Error: 22: Invalid argument 

Sun Dec 16 21:27:34 2007 

DBW3: terminating instance due to error 27061 

Instance terminated by DBW3, pid - 462948 


严重 时 会 导致 宕 机 。 这 个 bug 在 Oracle 9.2 和 Oracle 10.2 中 都 有 ， 因 此 建议 在 安装 数据 库 时 将 
maxregs 参数 调整 为 8192 或 者 更 高 。 

参数 maxservers fil minservers 仅 适 用 于 使 用 文件 系统 的 环境 。maxservers 是 每 个 CPU 
最 大 的 AIO Server 的 数量 ,而 不 是 系统 中 AIO Server 的 总 数 。 对 于 IO 比较 高 的 系统 ， 需 要 设置 
较 大 的 maxservers 参数 。 通 过 pstat 命令 ， 可 以 查看 当前 AIO Server 的 数量 ， 如 果 已 经 接近 
或 者 达到 了 最 大 的 AIO Server 数量 ， 那 么 就 需要 加 大 maxservers 参数 了 : 





























LN-BILL-DB-JF || / # pstat -a|grep aios 
66 a 428a ii 428a 0 0 aioserver 
67 a 438c 438c 0 0 aioserver 
69 a 458c 458c 0 0 aioserver 
70 a 468c 468c 0 0 aioserver 
71 a 478e 1 478e 0 0 aioserver 
72 a 4890 I 4890 0 0 aioserver 
了 3 a 4992 4992 0 0 aioserver 
74 a 4a94 4a94 0 0 aioserver 
75 a 4596 1 4596 0 0 aioserver 
76 a 4c98 1 4c98 0 0 1 aioserver 

对 于 虚拟 内 存 管理 来 说 , 作为 Oracle 服务 器 使 用 的 系统 , 是 不 需要 多 少 文件 缓冲 的 。 文 件 缓 


冲 不 会 提高 Oracle 数据 库 的 性 能 ， 因 为 Oracle 数据 库 本 身 有 自己 的 DB Cache, AIX 操作 系统 参 
数 maxperms 可 以 限制 文件 缓存 占用 物理 内 存 的 百分比 。 不 过 ATX 操作 系统 默认 的 maxperms 值 
是 80%， 这 是 一 个 很 高 的 值 ， 并 不 适合 于 Oracle 数据 库 服务 器 。 因 此 在 调整 AIX 操作 系统 时 ， 
建议 将 maxperm% 调 整 为 10% 或 者 更 小 。 

IBM 的 工程 师 可 能 会 说 文件 缓冲 是 可 以 释放 的 。 一旦 操作 系统 需要 , 就 可 以 将 文件 缓冲 的 内 
存 释 放出 来 使 用 , 且 确 实在 IBM 的 相关 技术 资料 中 ,都 建议 在 ATX 5.3 以 后 的 版 本 中 安装 Oracle 
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数据 库 时 ， 设 置 maxperm% 为 90% 一 95%， 同 时 设置 lru file repage 为 0。 从 原理 上 来 看 , 这 
种 设置 不 无 道理 , 不 过 由 于 Unix 的 算法 问题 , 这 些 被 文件 缓冲 占用 的 内 存 的 释放 需要 一 个 过 程 ， 
释放 这 些 内 存 往 往 伴随 着 IO 和 换 页 。 当 物理 内 存 十 分 小 时 ， 由 于 没有 达到 最 低 国 值 ， 所 以 文件 
缓冲 中 的 内 存 不 会 释放 。 而 这 个 时 候 如 果 有 一 个 比较 消耗 内 存 的 操作 发 生 , 那么 文件 缓冲 的 内 存 
需要 释放 ， 这 样 就 会 绰 上 大 量 的 LO 和 换 页 操作 ， 在 某 个 瞬间 可 能 导致 系统 资源 被 过 度 消耗 ， 引 
起 短暂 的 性 能 瓶 开 ， 严重 时 还 可 能 产生 一 些 预想 不 到 的 后 果 。 我 曾经 碰 到 过 一 个 客户 ， 由 于 做 了 
— FTP 操作 ， 想 把 一 个 40GB 的 备份 集 复制 到 另外 一 台 服 务 器 上 ，FTP 刚刚 开始 不 到 半分 钟 ， 

个 布点 上 的 RAC 实例 就 容 了 。 后 来 经 检查 发 现 ， 这 个 节点 被 RAC 驱逐 了 。 这 是 由 于 文件 缓冲 
释放 时 产生 了 大 量 系 统 调 用 ，CPU 和 VO 资源 都 出 现 了 不 足 ， 最 终 造 成 R AC 之 间 的 通信 超时 。 
被 另外 一 个 节点 认为 这 个 节点 出 现 了 故障 ， 主 动 驱逐 了 这 个 故障 节点 。 

对 于 pbuf 的 调整 ， 主 要 取决 于 操作 系统 中 裸 设备 访问 是 否 引起 了 大 量 的 pbuf 等 待 。 在 别 的 
操作 系统 下 ,， 一般 来 说 查看 VO 是 否 存 在 等 待 ， 可 以 看 vmstat 命令 的 b 字段 的 值 ; 对 于 AIX BR 
作 系 统 ， 如 果 使 用 文件 系统 ， 可 以 看 b 的 值 ， 而 对 于 使 用 裸 设备 的 系统 ，b 可 能 永远 为 0。 比 如， 
下 面 的 系统 就 是 使 用 裸 设备 的 : 

































































LN-BILL-DB-JF || / # vmstat 1 10 

System Configuration: lcpu-6 mem-12288MB 

kthr memory page faults cpu 

r b avm fre re pi po fr sr cy in Sy cS us sy id wa 

2 11963449 565281 0 0 120 67 0 150 28237 20593 18 7 67 8 

1 01964106 564582 0 0 0 0 0 0 14039 47759 37195 16 24 53 7 

1 0 1963522 565166 0 0 0 0 0 0 13860 41577 33567 13 15 64 8 

2 01963803 564884 0 0 0 0 0 0 13195 39947 31459 12 14 67 7 

7 0 1964053 564634 0 0 0 0 0 0 14537 45937 36789 26 29 35 10 

5 0 1964071 564625 0 0 0 0 0 0 15405 48860 41174 22 25 46 7 

0 0 1963522 565164 0 0 0 0 0 0 13498 34095 32703 10 10 75 5 

1 01963846 564839 0 0 0 0 0 0 12381 46809 30043 15 20 57 7 

3 0 1963534 565151 0 0 6 0 0 0 15080 44522 38531 26 27 37 11 

2 01964185 564500 0 0 0 0 0 0 15801 41351 42505 20 20 50 10 

如 果 使 用 vmstat -I 命令 ,就 可 以 看 到 另外 的 现象 ， 具 体 如 下 : 

root:/>vmstat -I 2 10 
kthr memory page faults cpu 

r b p avm fre fi fo pi po fr. ee in Sy cs us sy id wa 
4 1 15 1529390 648297 31 63 0 0 63 336 199 26183 8006 42 9 36 13 
3 0 45 1531733 645953 0 0 0 0 0 0 4672 30147 10393 38 14 0 48 
7 038 1533274 644410 0 1 0 0 0 0 5430 39781 11837 52 16 0 33 
2 037 1531244 646439 0 0 0 0 0 0 4726 32458 10638 40 15 0 45 
5 0 38 1533318 644364 0 0 0 0 0 0 4096 22612 29455 37 11 0 52 
2 0 41 1530308 647373 0 64 0 1 0 0 4122 24930 29439 36 15 0 49 
3 0 40 1534883 642797 0 0 0 0 0 0 4179 29303 29481 46 13 0 41 
5 0 41 1536024 641654 0 0 0 0 0 0 4138 28142 29851 32 14 0 54 
3 041 1531396 646281 0 0 0 0 0 0 4414 30345 10438 42 14 0 44 
0 034 1532657 645019 0 0 0 0 0 0 5125 34884 12842 36 1 0 54 
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可 以 看 到 ，b 的 值 相 当 高 ， 这 是 由 于 裸 设备 的 VO 访问 存在 较为 严重 的 性 能 问题 。 这 个 时 候 
使 用 vmstat -v， 可 以 看 到 一 些 和 1O 相关 的 信息 ， 有 具体 如 下 : 


root:/»vmstat -v 
2097152 
1985190 
222013 
2 
136502 
80.1 
55.0. 
12.0 
11.9 
237978 
0.0 

OR 

12. 

0 
1393707 
288770 
93511 

0 

0 


从 上 面 的 代码 可 以 看 到 ， 





memory pages 

lruable pages 

free pages 

memory pools 

pinned pages 

maxpin percentage 

minperm percentage 

maxperm percentage 

numperm percentage 

file pages 

compressed percentage 

compressed pages 

numclient percentage 

maxclient percentage 

client pages 

remote pageouts scheduled 

pending disk I/Os blocked with no pbuf 
paging space I/Os blocked with no psbuf 
filesystem I/Os blocked with no fsbuf 
client filesystem I/Os blocked with no fsbuf 
external pager filesystem I/Os blocked with no fsbuf 


由 于 缺乏 pbuf 而 导致 等 待 。 在 一 天 的 业务 高 峰 期 开始 和 结束 时 各 


执行 一 次 这 个 命令 ， 就 可 以 看 出 在 业务 高 峰 期 由 于 pbuf 不 足 而 导致 的 等 待 事件 有 和 多少。 如 果 这 
个 等 待 增长 十 分 快 ， 那 么 就 说 明 pbuf 需要 进行 优化 。 要 注意 的 是 ，pbuf 的 调整 需要 十 分 小 心 。 
调整 不 当 反 而 会 降低 系统 性 能 , 并 且 pbuf 在 AIX 的 不 同 版 本 的 策略 是 不 同 的 ,调整 方法 也 不 同 ， 
调整 之 前 一 定 要 认真 阅读 IBM 的 相关 手册 。 





4 


5 有 308 A 账 务 处 理 


今天 是 账 期 处 理 的 第 一 天 ， 老 于 建议 我 好 好 休息 一 下 ,晚点 过 去 ， 他 过 去 顶 一 下 。 其 实 我 没 
有 睡懒觉 的 习惯 ， 早 上 还 是 7 : 30 就 起 床 了 ， 到 餐厅 吃 完 早饭 后 又 回 到 酒店 ， 躺 在 床上 看 看 “第 
一 时 间 ” 节 目 。 在 深圳 的 时 候 ， 早 上 我 一 般 会 看 看 江川 主持 的 “第 一 现场 "， 或 者 看 看 央视 2 E 
的 “第 一 时 间 ”。 我 准备 中 午 的 时 候 直接 到 北 站 那 边 吃 午 餐 , 那 边 12 块 钱 的 自助 午餐 还 是 不 错 的 。 

下 午 到 办 公 室 时 老 于 正在 帮 客 户 优化 一 个 统计 程序 。 这 个 统计 程序 每 个 月 的 月 底 都 要 执行 一 
次 ， 随 着 数据 量 的 增加 ， 这 个 程序 越 跑 越 慢 ， 上 个 月 跑 了 3 个 多 小 时 才 出 来 ， 这 回 跑 了 将 近 6 个 
小 时 才 出 来 。 老 于 看 了 一 下 ， 这 是 一 个 7 张大 表 连 接 的 查询 ， 其 中 4 张 是 超过 300MB 的 大 表 ， 
一 张 是 150MB 的 表 ,一 张 是 50 多 兆 字 节 的 远程 表 。 整 个 SOL 的 执行 计划 十 分 复杂 ,还 涉及 dblink, 
老 于 帮 他 们 调整 了 一 下 SQL， 使 用 了 一 个 临时 表 ， 结 果 两 个 小 时 就 完成 了 统计 。 

我 又 看 了 一 下 ， 临 时 表 确 实 起 到 了 很 好 的 作用 。 在 原来 的 SQL 里 ， 临 时 表 产 生 的 结果 集 被 
多 次 使 用 ， 每 次 使 用 都 要 重新 扫描 一 遍 ACCT 表 ， 而 这 张 表 的 大 小 超过 500MB, ， 而 生成 的 临时 
表 数 据 只 有 几 十 兆 字 节 。 这 种 情况 是 典型 的 可 以 通过 临时 表 进 行 优化 的 。 

老 于 看 到 我 来 了 ， 说 :“ 老 白 ， 看 看 能 不 能 再 优化 一 点 ， 客 户 还 是 嫌 太 慢 .” 我 说 老 于 你 先 回 
酒店 休息 一 下 吧 ， 这 个 SQL 我 继续 搞 。 老 于 走 后 ， 我 看 了 一 下 ， 目 前 老 于 把 一 个 SQL 拆 成 了 两 
个 SQL， 由 于 减少 了 对 ACCT 这 张大 表 的 访问 ,效率 提 高 了 不 少 。 不 过 对 于 临时 表 的 访问 还 是 
有 10 次 ， 临 时 表 的 大 小 虽然 瘦身 到 了 1/10 的 大 小 ， 不 过 还 是 有 优化 的 余地 。 如 果 在 临时 表 上 创 
建 一 个 索引 , 那么 就 不 需要 对 临时 表 进 行 全 表 扫 描 了 , 而 且 这 10 个 结果 集 是 不 会 有 重复 记录 的 。 
如 果 把 UNION 改 为 UNION ALL， 就 可 以 减少 不 必要 的 剔 重 操作 了 ， 所 以 我 给 客户 以 下 的 建议 。 
a 在 临时 表 上 创建 索引 ， 进 一 步 提高 临时 表 的 访问 效率 。 在 将 临时 表 插 入 数据 之 前 删除 索 
引 ， 数 据 插入 完毕 后 创建 索引 。 

a 将 多 个 结果 集 的 UNION 操作 改 为 UNION ALL, 

a 通过 Hash 连接 替代 以 前 的 虑 套 循 环 。 

a 在 执行 这 个 SQL 前 , 加 大 PGA AGGREGATE TARGET 的 值 , 执行 完毕 后 再 将 该 参数 改 回 原 
来 的 值 。 

调整 PGA_AGGREGATE_TARGET 值 的 目的 是 提高 Hash 连接 的 效率 。 由 于 这 个 模块 一 般 在 非 营 
业 时 间 执 行 ， 所 以 有 足 有 的 内 存 供 系统 使 用 ， 完 全 可 以 通过 加 大 PGA_AGGREGATE_TARGET 来 增 
加 Hash 连接 的 缓冲 区 的 大 小 。 但 是 由 于 物理 内 存 有 限 ， 在 营业 时 间 无 法 设置 更 高 的 PGA_AGGR- 
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EGATE_TARGET， 所 以 这 个 SQL 执行 完毕 后 , 这 个 参数 必须 还 原 。 还 好 PGA_ AGGREGATE TARGET 
这 个 参数 是 动态 的 ， 可 以 随时 调整 。 

根据 上 面 的 思路 调整 后 ， 我 们 再 次 执行 了 这 个 模块 ， 刚 才 的 调整 起 到 了 神奇 的 作用 ， 不 到 
20 分 钟 ， 这 个 模块 就 跑 完了 。 通 知 业 务 部 门 对 生成 的 数据 进行 核对 ， 结 果 和 刚才 做 的 完全 一 致 。 

其 实 SQL 优化 有 时 候 就 是 这 样 ， 其 中 并 没有 特别 高 深 的 技术 ， 每 种 优化 技术 都 很 简单 ， 但 
是 这 些 技术 如 何 使 用 、 如 何 组 合 才能 达到 最 大 的 效果 是 十 分 关键 的 。 水平 高 的 人 就 是 能 够 找到 这 
些 组 合 的 人 。 比 如 说 对 于 绝 大 多 数 统计 程序 来 说 ，Hash 连接 往往 比 和 能 套 循环 的 效率 高 ， 因 为 统 
计 往 往 是 对 大 量 数据 的 汇总 处 理 , 索引 的 效率 往往 并 不 能 决定 整个 程序 的 性 能 ,而 连接 方式 往往 
对 性 能 的 影响 更 大 。 在 这 个 优化 案例 里 , 临时 表 的 使 用 提高 了 数据 的 使 用 效率 ， 从 而 使 性 能 提升 
了 3 倍 以 上 。UNION ALL 的 使 用 减少 了 结果 集 吻 重 的 开销 ， 使 性 能 提升 了 10%， 不 过 起 到 最 大 
作用 的 是 Hash 连接 的 使 用 。Hash 连接 的 使 用 使 两 张大 表 的 连接 只 通过 对 两 张 表 进 行 一 遍 扫 描 就 
完成 了 ， 这 样 比 虑 套 循 环 的 效率 高 了 很 多 倍 。 

下 午 其 实 没 有 什么 事情 ,今天 是 周末 ， 只 有 做 账 务 处 理 的 人 在 现场 ， 看 着 他 们 忙碌 的 样子 ， 
我 们 也 帮 不 上 什么 忙 。SQL 分 析 已 经 基本 完成 , 这 几 天 实际 上 是 要 看 看 账 务 处 理 过 程 中 还 有 哪些 
SQL 需要 优化 ， 其 他 的 工作 比较 少 。 

晚上 和 老 于 就 在 故宫 附近 找 了 家 李 连 贵 得 肉 大 饼 ， 要 了 瓶 二 锅 头 。 二 两 二 锅 头 下 肚 , ETE 
起 了 感慨 。 做 DBA 十 多 年 了 ， 越 来 越 感觉 信心 不 足 ， 看 看 网 上 一 批 年 轻 人 发 的 文章 和 博客 ， 真 
有 长 江 后 浪 推 前 浪 的 感觉 ， 怕 这 么 下 去 ， 用 不 了 几 年 自己 越 来 越 没 价值 了 。 

确实 , 我 们 这 批 DBA 大 多 数 是 从 20 世纪 90 年 代 初 开始 接触 Oracle AY, 那 时 候 参 考 书 很 少 ， 
其 至 连 Metalink 账号 都 不 大 普及 。 这 批 DBA Hee ACE LE PRR RABI, ME 
础 往往 都 比较 薄弱 。 老 于 感觉 做 了 这 么 长 时 间 DBA， 有 些 江 郎 才 尽 的 感觉 ， 真 怕 某 天 会 被 询 汰 
f. 

我 安慰 老 于 说 ，DBA 是 一 个 实践 性 很 强 的 职业 ， 虽 然 在 某 些 理论 方面 ， 我 们 这 批 人 没有 年 
轻 人 研究 的 那么 深 ， 不 过 殊途同归 。 真 正 碰 到 问题 ， 以 我 们 的 经 验 ， 我 们 也 能 做 出 正确 的 判断 。 
解决 问题 ， 这 十 多 年 的 经 验 积累 也 不 是 空中 楼 癌 。 有 些 人 虽然 理论 基础 十 分 好 ,， 不 过 如 果 缺 乏 实 
践 经 验 ， 那 么 也 很 难 把 理论 融入 实践 中 ， 磁 到 问题 照样 无 所 适 从 。 

现在 OTN 论坛 上 也 经 常 有 两 大 派 的 人 在 和 争吵， 一 派 是 经 验 派 ， 基 本 上 都 是 工作 八 九 年 以 上 
的 老 DBA， 另 外 一 派 是 学 院 派 ， 理 论 基础 十 分 扎实 ， 基 本 上 是 最 近 三 五 年 才 开 始 从 事 DBA 工作 
的 人 。 经 验 派 倚 老 卖 老 ， 学 院 派 满嘴 INTERNAL， 大 家 吵 得 不 可 开交 。 实 际 上 作为 DBA， 经 验 
和 理论 都 是 必 不 可 少 的 。 随 着 年 龄 的 增长 ， 学 习 能 力 逐 新 下 降 ， 再 过 几 年 ， 现 在 的 学 院 派 可 能 就 
会 成 为 那 时 的 经 验 派 ， 经 验 增长 了 ， 理 论 反 而 苇 玻 了 。 

晚上 回来 后 ， 老 于 提 的 问题 让 我 思考 了 很 多 。 这 些 年 吃 老 本 比较 多 ， 真 正 的 学 习 比 较 少 了 ， 
作为 DBA， 知 识 更 新 是 十 分 快 的 。 而 随 着 年 龄 的 增长 ， 学 习 能 力 越 来 越 弱 ， 早 晚 有 一 天 ， 老 于 
的 忧虑 也 会 成 为 我 的 忧虑 。 我 们 这 批 老 DBA 都 比较 怀旧 ， 几 年 前 我 是 坚决 不 接受 Oracle 9i AY, 
因为 我 一 直 认 为 Oracle 8i 太 完美 了 ， 直 到 有 一 天 我 做 了 一 个 Oracle 9i 调 优 的 项 目 ， 才 开始 真正 




































































170 Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





去 认真 研究 Oracle 9i， 发 现 原来 Oracle 9i 更 加 完美 。Oracle 10g 出 来 好 长 时 间 了， 我 还 没 认真 看 
看 Oracle 10g 的 新 特性 呢 ， 看 样子 ， 我 还 真 要 好 好 研究 研究 Oracle 10g 了 。 做 DBA 的 ， 不 进 则 
退 ， 不 学 习 看 样子 是 不 行 了 。 

转 过 念头 又 一 想 ， 这 其 实 也 没什么 ， 毕 竟 DBA 只 是 一 个 工作 ， 而 不 是 生活 的 全 部 。 工 作 是 
为 了 更 好 地 生活 ,而 不 是 工作 本 身 ， 因 此 也 没 必 要 对 自己 太 苛 刻 了 ， 上 回 吃饭 时 老 方 就 说 他 坚决 
` 会 再 学 Oracle 10g 了 ， 准 备 就 靠 手 头 这 些 东西 吃 老 本 了 ， 现 在 想 想 也 对 ， 都 是 奔 四 的 人 了 ,能 
把 自己 的 经 验 传授 给 年 轻 人 ， 就 已 经 很 不 错 了 ， 再 和 年 轻 人 去 比赛 新 技术 ， 怕 是 吃力 不 讨好 了 。 
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使 用 临时 表 进 行 SQL 优化 是 DBA 经 常 使 用 的 手段 ， 就 像 老 于 帮助 客户 做 的 那样 。 开 发 人 员 
喜欢 在 一 个 SQL 中 生成 所 有 的 数据 ， 这 也 是 DBA 最 头痛 的 。 在 做 优化 项 目 中 老 白 也 经 常 碰 到 一 
些 SQL， 面 有 NN 个 相 类 似 的 SQL 做 UNION 或 者 UNION ALL， 这 些 SQL 都 是 对 相同 的 表 按 照 不 
同 的 条 件 进行 扫描 , 今天 这 个 SQL 就 是 一 个 有 10 个 UNION 操作 的 查询 ,只 是 其 中 的 某 个 WHERE 
条 件 有 略微 的 不 同 。 这 种 情况 下 , 这 个 SQL 要 对 一 个 复杂 的 查询 运行 10 次 , 然后 才能 得 到 结果 。 
换 一 个 思路 ， 首 先 把 这 10 个 UNION 操作 所 需要 访问 的 数据 查询 出 来 ， 这 部 分 数据 可 能 只 是 原来 
数据 的 几 十 分 之 一 甚至 几 百 分 之 一 , 这 部 分 数据 先 存在 一 张 临 时 表 中 ,然后 对 这 张 临时 表 进 行 查 
询 ， 那 么 这 个 SQL 的 效率 可 能 提高 数 倍 甚至 数 十 倍 。 

其 实 今天 使 用 的 优化 方案 还 不 是 很 彻底 的 , 原本 老 白 提出 了 一 个 更 为 彻底 的 优化 方案 , 后 来 
由 于 应 用 修改 较 大 , 并 且 通 过 调整 后 的 应 用 性 能 已 经 能 够 满足 客户 要 求 了 , 因此 就 没有 进一步 优 
化 。 实 际 上 ， 这 个 调整 后 的 优化 方案 还 是 对 临时 表 进 行 了 10 次 扫描 才 产 生 了 结果 ， 其 实 如 果 把 
SQL 修改 为 一 个 存储 过 程 ， 那 么 只 需要 扫描 一 遍 临 时 表 ， 就 可 以 生成 这 个 SQL 的 结果 了 。 比 如 
下 面 的 语句 : 


SELECT 'A',COUNT(*) FROM TMP WHERE STATUS-'A' 
UNION ALL 
SELECT 'B',COUNT(*) FROM TMP WHERE STATUS-'B' 











SELECT 'C',COUNT(*) FROM TMP WHERE STATUS-'C' 





SELECT 'D',COUNT(*) FROM TMP WHERE STATUS-'D'; 
如 果 上 面 的 SQL 需要 对 临时 表 扫 描 4 次 ， 那 么 可 以 改写 为 一 个 存储 过 程 ， 具体 如 下 : 


DECLARE 

VA: INTEGER; 

VB: INTGER; 

VC: INTEGER; 

VD: INTEGER; 
BEGIN 

VA:=0;VB:=0;VC:=0;VD:=0; 

FOR C IN (SELECT STATUS FROM TMP) LOOP 
IF C.STATUS='A' THEN 
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VA:=VA+1; 





IF C.STATUS='B' THEN 
VB:=VB+1; 


IF C.STATUS='C' THEN 
VC:=VC+1; 


ELSE 
IF C.STATUS='D' THEN 


END IF; 








m 今 优化 小 技巧 ) 表 访 问 的 方式 


今天 的 日 记 里 提 到 了 一 个 SQL 优化 的 问题 ,其 中 涉及 了 使 用 Hash 连接 还 是 符 套 循环 的 问题 ， 
所 以 现在 介绍 一 下 和 SQL 执行 计划 有 关 的 知识 。 在 讨论 表 访 问 方式 之 前 ， 我 们 先 来 熟悉 一 些 和 
SQL 执行 计划 有 关 的 技术 术语 。 

à Row Source; 一 个 实现 某 种 操作 并 且 返 回 一 个 结果 集 的 函数 。 

O Predicate: 查询 的 WHERE 条 件 。 

Q Tuples: 返回 的 记录 。 

O Driving Table: 驱动 表 ， 作 为 查询 种 子 的 行 源 (Row Source). 

口 Probed Table; 和 驱动 表 连 接 的 表 。 

在 物理 层 ，Oracle 读 取 数据 的 最 小 单位 是 块 ，Oracle 读 取 数据 的 最 大 限制 取决 于 操作 系统 和 
Oracle 对 多 块 读 VO 的 限制 。 从 物理 上 来 说 , 一 个 SQL 语句 要 读 取 某 个 记录 ， 必 须 将 该 记录 读 取 
到 DB Cache 中 ， 然 后 才能 从 中 获取 ， 这 种 访问 我 们 一 般 称 为 物理 读 (READ); 如 果 这 个 数据 已 
经 存在 于 DB Cache 中 ， 那 么 前 台 进 程 可 以 直接 从 DB Cache 中 读 取 数据 ， 这 样 的 读 取 称 为 逻辑 
读 (GET); 如 果 要 读 取 的 数据 已 经 被 修改 , 需要 从 undo 表 空 间 中 读 取 前 映像 来 获取 一 致 性 数据 ， 
那么 会 从 undo 表 空 间 中 取出 前 上 映像， 和 当前 的 数据 块 一 起 形成 一 个 一 致 性 读 块 (CR BLOCK), 
然后 再 从 一 致 性 读 块 中 读 取 数据 ， 这 种 访问 方式 称 为 一 致 性 读 (CR GET), 

MWE, Oracle 通过 3 种 途径 读 取 数据 : 全 表 扫 描 (Full Table Scan，FTS)、 索 引 扫 描 、 
通过 ROWID 直接 访问 。 在 阅读 SQL 执行 计划 时 ， 可 以 通过 TABLE ACCESS 子 句 来 查看 Oracle 
访问 某 个 表 的 方法 。 一 般 大 型 的 表 ， 如 果 出 现 TABLE ACCESS FULL 的 提示 ， 就 需要 加 以 重视 。 
一 般 情 况 下 ， 对 于 大 表 的 全 表 扫 描 ， 应 该 尽量 避免。 

了 解 访问 的 详细 方式 , 有 助 于 开发 人 员 和 DBA 进行 SQL 优化 时 抓 住 重点 , 避免 错误 。 因此 ， 
本 节 将 详细 介绍 各 种 访问 方式 。 
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1. 全 表 扫 描 
在 一 次 全 表 扫 描 执 行 中 ， 整 个 表 被 扫描 ， 直 到 高 水 位 标志 (High Water Mark, HWM) 标示 
的 位 置 。 高 水 位 标志 指向 该 表 包 含 数 据 的 最 后 一 个 数据 块 的 位 置 。 如 果 你 的 表 中 有 1 000 万 条 记 
录 ， 当 你 用 DELETE 语句 删除 了 所 有 数据 后 ， 高 水 位 标志 仍然 标示 删除 前 最 后 一 个 块 的 位 置 ， 因 
此 ， 如 果 这 个 时 候 对 这 张 表 进行 了 全 表 扫 描 , 那么 还 是 要 读 大 量 的 数据 块 ， 而 不 是 像 大 家 想象 的 
那样 ， 不 需要 读 任 何 数据 块 了 。 
如 果 我 们 进行 一 次 TRUNCATE TABLE 操作 ， 那 么 高 水 位 标志 会 被 设置 为 表 的 第 一 个 数据 块 ， 
那样 如 果 进 行 全 表 扫 描 ， 就 不 需要 扫描 那么 多 数据 块 了 。 由 于 全 表 扫 描 的 这 种 特性 ， 需 要 访问 所 
有 的 高 水 位 以 下 的 数据 块 ， 所 以 需要 尽量 避免 全 表 扫 描 。 如 果 全 表 扫 描 是 不 可 避免 的 ,那么 如 果 
大 量 删 除数 据 后 ， 需 要 对 表 进 行 重组 ， 否 则 全 表 扫 描 时 还 是 会 扫描 所 有 的 数据 。 

进行 全 表 扫 描 时 , 是 采用 多 块 读 的 方式 , 多 块 读 由 db block multiblock read count # 
数控 制 。 多 块 读 的 数据 会 被 放置 在 数据 块 缓冲 的 LRU 队列 的 尾部 ， 这 样 这 些 数据 会 在 尽 可 能 短 
的 时 间 内 被 换 出 。 

2. 索引 扫描 

从 索引 中 可 以 获得 数据 的 ROWID , 通过 ROWID 可 以 直接 定位 到 数据 。 ROWID 可 以 唯一 性 
地 定位 到 某 一 条 记录 的 物理 位 置 。 看 下 面 的 例子 : 


SQL» explain plan for select empno,ename from emp where empno-10; 
Query Plan 











SELECT STATEMENT [CHOOSE] Cost=1 
TABLE ACCESS BY ROWID EMP [ANALYZED] 
INDEX UNIQUE SCAN EMP I1 


如 果 所 需要 的 所 有 信息 可 以 直接 从 索引 中 获得 ， 不 需要 访问 表 ， 那 么 执行 计划 是 这 样 的 : 


SOL» explain plan for select empno from emp where empno-10; 
Query Plan 


SELECT STATEMENT [CHOOSE] Cost-1 
INDEX UNIQUE SCAN EMP I1 


索引 访问 也 不 一 定 全 部 是 UNIQUE SCAN， 也 可 能 会 产生 范围 扫描 ， 比 如 : 


SQL> explain plan for 

SELECT empno,ename 

FROM emp 

WHERE empno » 7876 order by empno; 





Query Plan 

SELECT STATEMENT [CHOOSE] Cost=1 
TABLE ACCESS BY ROWID EMP [ANALYZED] 
INDEX RANGE SCAN EMP_I1 [ANALYZED] 


常见 的 索引 访问 模式 有 以 下 儿 种 。 
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口 


index unique scan; 一 般 是 主键 或 者 唯一 性 索引 访问 。 
index range scan: 一 般 在 查询 条 件 里 存在 范围 性 条 件 。 
index full scan; 按照 索引 的 顺序 进行 全 扫描 。 一 般 来 说 ， 如 果 发 现 全 索引 扫描 的 性 能 好 于 
全 表 扫 描 ， 才 会 采用 这 种 方式 ， 并 且 扫 描 出 来 的 数据 是 有 顺序 的 。 
index fast full scan: 扫描 索引 的 所 有 块 ， 返 回 的 数据 不 是 按照 索引 顺序 的 。 
index skip scan; 索引 跳跃 扫描 。 如 果 WHERE 条 件 的 字段 不 是 索引 的 键 值 的 第 一 个 键 ， 在 
不 支持 index skip scan 的 系统 中 ， 这 个 索引 是 无 法 使 用 的 ;支持 该 访问 方式 的 系统 中 ， 可 
以 跳跃 式 扫描 索引 ， 完 成 访问 。 从 Oracle 9i 开 始 ，Oracle 支持 这 种 访问 方式 。 

3. ROWID 访问 

这 是 访问 数据 的 最 快 方式 ， 如 果 查 询 中 存在 WHERE ROWID=:X， 那 么 不 需要 通过 任何 索引 ， 
直接 可 以 定位 到 这 条 记录 的 物理 位 置 ， 访 问 该 数据 。 





口 
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口 





口 
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Hey 
5 月 31 日 À 电脑 坏 了 


今天 上 午 和 孙 主 任 确认 了 优化 实施 的 时 间 ， 然 后 又 分 析 了 几 个 SQL。 通 过 前 一 段 时 间 的 工 
作 , 关键 的 Top SQL 已 经 基本 上 找 出 了 , 剩 下 的 就 要 看 今天 开始 这 几 天 半夜 做 的 批 处 理 里 面 有 没 
有 什么 需要 优化 的 了 。 之 前 我 们 已 经 把 STATSPACK 采样 的 周期 缩短 为 30 分 钟 ， 以 便于 更 好 地 
进行 分 析 。 本 来 想 把 Snap Level 设置 为 6, 这 样 就 能 够 采集 到 SQL 的 执行 计划 了 ,不 过 考虑 到 把 
Snap Level 设置 为 6 会 加 大 Snap 采样 时 的 成 本 ，CPU 就 更 吃不消 了 ， 最 后 只 能 放弃 了 。 

老 于 这 儿 天 都 在 和 老 肖 一 起 整理 优化 方案 , 由 于 事情 比较 多 ,抽烟 也 比 平时 少 了 不 少 。 快 中 
午时 , 我 走 过 去 拍 拍 正在 对 着 显示 器 发 呆 的 老 于 ， 找 他 一 起 出 去 抽 根 烟 。 大 半 个 月 过 去 了 , 这 有 段 
时 间 大 家 绷 得 都 很 紧 。 不 过 下 个 月 初 的 第 一 次 优化 才 是 最 关键 的 ， 对 于 我 们 这 个 优化 小 组 来 说 ， 
起 码 也 算 上 是 一 次 期 中 考试 ， 如 果 成 绩 不 理想 ， 那 就 麻烦 了 。 优 化 项 目的 成 败 和 客户 的 支持 程度 
有 很 大 的 关系 ， 如 果 客 户 丧 失 了 对 你 的 信任 ,那么 你 做 的 每 个 操作 都 可 能 面临 相当 大 的 压力 。 因 
为 在 系统 优化 中 ,任何 一 个 操作 都 存在 一 定 的 风险 。 辽 宁 这 个 项 目 ， 孙 主任 的 支持 是 一 个 很 好 的 
保障 , 这 种 情况 下 我 们 还 地 稍微 冒 点 险 。 在 绝 大 多 数 优化 项 目 中 , 甲 方 的 人 都 希望 能 很 快 出 成 绩 ， 
调 好 了 什么 都 好 说 ， 如 果 第 一 次 实施 后 出 现 了 副作用 ， 就 可 能 成 为 甲 方 的 替罪羊 ， 甚 至 可 能 马上 
被 客户 赶 走 。 

在 优化 项 目 中 出 现 一 些 反 复 也 很 正常 , 但 是 甲 方 可 能 并 没有 这 样 的 准备 。 因 为 甲 方 的 项 目 负 
责 人 直接 对 自己 的 领导 负责 , 而 领导 是 不 知道 数据 库 优 化 是 怎么 回 事 的 。 领导 们 一 般 会 认为 花 钱 
请 了 专家 来 优化 ， 就 一 定 要 看 到 效果 ， 就 像 交 换 机 容量 不 够 了 ,， 花 点 钱 扩容 一 下 就 没 问 题 了 。 一 
旦 出 现 优化 后 性 能 反而 下 降 这 种 情况 , 领导 的 第 一 个 反应 是 打 板子 , 而 这 个 板子 一 般 不 会 直接 打 
到 乙方 身上 , 会 打 到 甲 方 的 项 目 负责 人 身上 。 如 果 甲 方 的 项 目 负 责 人 挨 了 领导 的 批评 ,其 至 被 扣 
了 绩效 ,那么 这 股 弛 火 可 能 会 转嫁 到 乙方 身上 。 我 就 曾经 做 过 一 个 优化 项 目 ， 进 场 后 不 入 ， 甲 方 
的 项 目 主管 就 很 愤怒 地 找到 我 ， 问 我 为 什么 做 了 优化 反而 性 能 下 降 了 。 我 当时 很 旋 异 ， 因 为 项 目 
刚刚 开始 ， 这 些 天 我 们 一 直 在 进行 数据 采集 ， 根 本 没有 做 任何 优化 动作 。 我 就 告诉 那个 领导 ,我 
们 这 儿 天 只 是 在 分 析 系 统 , 采集 数据 ， 并 没有 做 任何 操作 。 他 说 为 什么 我 们 来 之 后 系统 性 能 会 下 
降 呢 , 是 不 是 你 们 采集 数据 影响 了 系统 性 能 。 我 告诉 他 我 们 采集 数据 基本 上 就 是 执行 几 个 简单 的 
SQL,， 不 会 对 系统 有 多 大 的 影响 ， 而 且 我 们 做 采集 时 会 尽量 避 开 业务 高 峰 时 段 。 这 几 天 系统 性 能 
下 降 是 由 于 最 近 的 业务 量 比 平 时 大 了 差不多 30%。 他 听 了 以 后 如 释 重负 , 说 只 要 不 是 我 们 搞 出 的 
事情 ， 他 就 没 责任 了 。 他 马上 拿 起 电话 ， 和 领导 诉 了 半天 昔 。 然 后 又 和 我 说 ， 为 什么 不 早点 告诉 
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他 这 几 天 系统 负载 比 平 时 大 , 害 的 他 今天 上 午 开局 务 会 时 被 业务 部 门 和 领导 猛 批 了 一 顿 。 最 后 很 
严厉 地 告诉 我 ， 以 后 碰 到 这 种 情况 一 定 要 第 一 时 间 通 知 他 。 

中 午 吃 晚饭 后 ， 我 和 老 于 一 起 在 门口 抽 了 根 烟 ， 才 进 办 公 室 。 走 到 电脑 面前 ， 发 现 电脑 的 屏 
幕 是 黑 的 ， 本 来 以 为 是 电脑 待机 了 。 按 了 一 下 电源 ， 发 现 没 有 任何 反应 。 技 掉 电 凶 ， 重 新 插 上 ， 
再 开机 ， 还 是 没 反 应 ， 看 样子 是 出 问题 了 。 马 上 让 老 于 上 网 搜 了 一 下 ， 找 到 了 一 家 三 好 街 的 HP 
维修 站 ， 马 上 打车 过 去 。 那 哥们 儿 打 开 电 脑 看 了 看 ， 说 CPU 坏 了 ， 还 好 在 保修 期 内 ， 可 以 免费 
更 换 主板 ， 不 过 主板 要 从 北京 发 货 ， 所 以 要 下 周一 才能 修好 。 没 办 法 ， 拆 下 硬盘 ， 把 电脑 交 给 维 
修 站 。 从 维修 站 出 来 后 ， 马 上 联系 小 齐 ， 看 看 能 不 能 借 一 台 笔 记 本 。 在 等 小 齐 回 电话 时 ， 我 在 旁 
边 的 配套 市 场 里 买 了 一 个 移动 硬盘 盒子 ， 如 果 借 到 电脑 ， 就 可 以 把 盘 里 的 数据 先 挝 上去。 

半 个 小 时 后 ,小 齐 那 边 有 回复 了 , 她 在 沈阳 HP 公司 借 到 一 台 笔 记 本 电脑 , 我 可 以 直接 去 拿 。 
沈阳 HP 公司 在 青年 大 街 上 ， 离 三 好 街 很 近 。 经 过 一 个 小 时 的 努力 ， 填 写 了 无 数 表 格 ， 这 人 台电 脑 
终于 归 我 了 。 打 开 电 脑 ， 输 入 HP 公司 登记 的 用 户 名 和 密码 ， 居 然 说 密码 错误 。 又 经 过 一 阵子 折 
腾 ,， 终 于 找到 了 电脑 原来 主人 的 手机 。 我 拨 通 了 电话 ， 电 话 那 头 传 来 一 个 熟悉 的 声音 ， 原 来 这 人 台 
电脑 原来 是 明 喻 的 。 我 们 也 算 老 相识 了 ，2004 年 做 海尔 项 目 时 ， 明 喻 是 海尔 项 目的 项 目 经 理 。 
明 喻 已 经 离开 HP 公司 ， 那 台电 脑 也 已 经 交 了 快 1 年 了 。 他 把 常用 的 几 个 密码 通过 短信 发 给 我 ， 
试 到 第 三 个 时 ， 居 然 成 功 了 。 开 机 时 感觉 这 台电 脑 比 我 那 台 要 慢 得 多 ， 开 机 以 后 确认 了 一 下 ， 原 
来 是 一 台 奔 腾 H 的 电脑 ， 怪 不 得 这 么 慢 了 ， 不 过 还 好 ， 内 存 有 512MB ， 可 以 凑合 着 用 。 电 脑 虽 
然 拿 回来 了 ， 不 过 安装 软件 又 是 一 件 麻 烦 事 。Oracle 9i 客户 端 是 必须 安装 一 个 的 ， 包 括 全 套 的 
OEM 客户 端 ， 这 是 我 优化 项 目 时 必须 使 用 的 工具 。 另 外 ，Toad 也 是 我 最 喜欢 的 工具 ， 一 直 用 不 
惯 8.0 版 本 ， 所 以 我 一 直 还 在 使 用 Toad 7.6, Toad 有 几 个 很 好 用 的 小 工具 ， 一 直 是 我 做 优化 分 析 
时 必用 的 ， 比 如 说 Toad 的 健康 检查 、SGA Trace 和 SCHEMA BROWSER。Toad 的 SCHEMA 
BROWSER 可 以 查看 某 个 对 象 的 大 小 ， 我 经 常用 来 对 表 和 索引 进行 分 析 。SGA Trace 功能 也 十 分 
有 用 ， 可 以 从 SGA 中 抓 取 SQL 语句 ， 并 按照 某 个 指标 值 进 行 排序 (比如 缓冲 区 获取 )， 在 使 用 
OEM Top SQL 之 前 ， 我 一 直 在 使 用 Toad 的 SQL Trace 来 分 析 Top SQL, 

除了 Oracle 数据 库 工具 外 ，Telnet 工具 也 是 必需 的 。 一 般 来 说 ， 我 会 使 用 NetTerm 和 
Xmanager。 平 时 我 比较 喜欢 用 NetTerm， 我 这 个 人 不 太 喜 欢 尝 试 新 鲜 事 物 ， 用 工具 本 着 够 用 
就 行 的 原则 。NetTerm 对 我 来 说 基本 够 用 了 。 我 使 用 Net Term 也 就 是 远程 登录 到 服务 器 上 ， 
同时 通过 会 话 日 志 记 录 我 的 整个 操作 过 程 ， 其 他 功能 基本 上 很 少 使 用 。Xmanager 是 在 需要 使 
用 X-Windows 时 的 首选 , 不 过 在 平时 做 项 目 时 , Xmanager 使 用 的 机 会 不 多 , 大 多 数 是 在 做 数 
据 库 安装 时 使 用 。 

除了 上 面 的 工具 外 ，UltraEdit 也 是 我 喜欢 的 工具 。 这 个 软件 很 小 巧 ， 功 能 也 不 错 。 回 到 办 公 
室 后 , 首先 安装 了 一 套 Oracle 9i 的 数据 库 。 原 本 准备 装 一 个 客户 端的 ,后 来 想 想 有 时 候 可 能 还 要 
做 一 些 试验 ， 所 以 装 个 RDBMS Server 也 许 能 有 点 用 。 借 来 的 这 台 机 器 确实 比较 慢 ， 装 个 Oracle 
9i 都 伦 了 将 近 两 个 小 时 。 

下 午 由 于 出 了 这 档 子 事情 ， 感 觉 时 间 过 得 很 快 ， 转 眼 就 到 下 班 时 间 了 。 客户 那 边 做 账 务 处 理 
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的 人 也 陆续 到 了 这 个 平时 很 少 来 的 办 公 室 , 准备 晚上 8 : OO 开始 账 务 处 理 。 临 走 前 ， 为 了 更 好 地 
监控 系统 在 半夜 账 务 处 理 时 的 状态 ， 我 把 OEM Performance Manager 也 启动 了 ,开启 了 其 中 的 健 
康 性 图 表 、 平 均 事 务 响应 时 间 、 文 件 成 本 、 门 锁 等 几 个 重要 的 视图 ， 设 置 采 样 时 间 为 1.5 分 钟 ， 
这 样 白天 就 可 以 通过 对 EM 的 回放 来 分 析 数 据 了 。 





o9 今日 点 评 

DBA 的 电脑 上 需要 安装 什么 软件 ? 经 常 有 人 问 老 白 , 其 实 每 个 DBA 都 有 自己 喜欢 使 用 的 软 
件 。 对 于 使 用 什么 软件 ， 用 得 习惯 、 用 得 熟练 就 好 。 因 为 工具 只 是 帮助 DBA 思考 , 在 DBA 进行 
分 析 时 提供 辅助 作用 。 因 此 ， 每 个 DBA 使 用 的 软件 一 定 要 和 自己 的 分 析 习 惯 相 吻合 。 对 于 初级 
DBA 来 说 ，Quest 公司 的 Spotlight 这 样 的 工具 十 分 有 效 ， 可 以 初步 分 析 数 据 库 的 总 体 情况 。 而 对 
于 资深 DBA Rik, Spotlight 工具 能 够 提供 的 帮助 就 比较 少 了 。 

今天 老 白 找 来 了 一 台 替 代 的 新 电脑 ， 虽 然 比较 烂 ,不 过 也 聊 胜 于 无 了 。 拿 到 电脑 后 ， 老 白 装 
了 一 系列 软件 。 老 白 的 电脑 上 都 有 些 什么 工具 软件 也 是 很 多 朋友 经 常 问 的 。 实 际 上 ， 老 白 的 电脑 
上 的 工具 软件 很 少 ， 具 体 如 下 所 示 。 

首先 老 白 的 电脑 上 肯定 会 装 有 数据 库 ，Oracle 9.2.0.8 和 Oracle 10.2.0.3 的 数据 库 各 有 一 个 。 
在 Oracle 9.2.0.8 的 数据 库 里 还 配置 了 一 个 OMS 的 服务 。 

Oracle 9i 的 数据 库 里 当然 安装 了 老 白 的 最 爱 OEM, OEM 工具 中 老 白 经 常 使 用 的 是 诊断 包 和 
优化 包 。 

Toad 是 老 白 十 分 喜欢 使 用 的 工具 ,不 过 老 白 的 电脑 里 安装 的 还 是 Toad 7.6。 对 于 工具 ， 只 要 
够 用 就 行 ， 并 不 是 越 新 越 好 。 

Spotlight 是 个 不 错 的 工具 ， 当 然 应 该 安装 。 不 过 使 用 这 个 软件 的 机 会 不 多 ， 因 为 Spotlight 
要 在 用 户 的 数据 库 中 创建 很 多 对 象 才 能 使 用 好 分 析 功 能 , 而 对 于 老 白 服务 的 绝 大 多 数 客 户 , 都 不 
允许 随便 创建 表 ， 所 以 也 只 能 忍痛 割爱 了 。 

实际 上 说 , 老 白 的 电脑 中 和 Oracle 相关 的 工具 只 有 上 面 这 几 个 了 ,。 老 白 陆续 使 用 过 其 他 工具 ， 
但 感觉 和 他 分 析 问 题 的 思路 不 一 致 ， 因 此 也 就 没有 继续 使 用 。 除了 Oracle 工具 外 , 其 他 一 些 系统 
工具 也 是 十 分 重要 的 。 

NetTerm 是 远程 登录 工具 ， 而 且 有 免费 版 的 。NetTerm 的 兼容 性 很 不 错 ， 主 流 的 操作 系统 下 
表现 都 不 错 ,而 且 这 个 软件 可 以 免 安 装 , 所 以 每 次 老 白 换 电 脑 时 只 要 把 安装 目录 复制 过 去 就 行 了 ， 
里 面 的 服务 器 定义 不 会 丢失 。NetTerm 的 会 话 日 志 功 能 也 十 分 好 ， 每 次 老 白 连 到 客户 系统 上 时 都 
会 开启 会 话 日 志 , 这 样 就 可 以 把 每 次 操作 的 情况 记录 下 来 。 老 白 写 这 本 书 时 , 很 多 细节 都 是 借助 
会 话 日 志 才 回忆 起 来 的 。 老 白 不 喜欢 使 用 支持 多 页 的 Telnet 工具 ， 这 不 是 说 多 页 支持 不 好 ， 而 是 
在 老 白 的 DBA 生涯 中 越 做 越 谨慎 了 。 五 六 年 前 老 白 还 是 很 喜欢 一 次 性 开 多 个 窗口 来 进行 操作 的 。 
而 随 着 DBA 工作 经 历 的 增加 , 现在 老 白 很 怕 在 同时 开 多 个 窗口 进行 操作 。 如 果 必 须 开 多 个 窗口 ， 
那么 绝对 要 保证 ， 多 个 窗口 都 是 连 到 同一 台 服 务 器 的 同一 个 Unix 账号 的 。 这 是 为 什么 呢 ? 作为 


























SH31H 电脑 坏 了 177 





一 名 DBA， 没 有 过 误 操 作 经 历 的 人 可 能 很 少 ， 有 时 候 误 操作 只 能 让 你 出 身 汗 ， 而 很 多 时 候 ， 误 
操作 可 以 让 你 万 动 不 复 。 大 概 七 八 年 前 吧 ， 老 白 碰 到 过 一 件 事 ， 当 时 在 一 个 客户 那里 做 服务 ， 和 
开发 商 的 人 坐 在 一 个 办 公 室 里 。 当 时 开发 商 有 个 哥们 刚刚 坐 火 车 回 到 客户 那里 , 正好 碰 到 两 件 事 
情 : 一 件 是 生产 库 上 有 个 进程 挂 住 了 ; 另外 一 件 是 测试 小 组 要 开始 新 一 轮 测 试 , 需要 清理 一 下 测 
试 机 的 数据 库 。 因 此 , 那个 哥们 开 了 两 个 窗口 , 分 别 进行 操作 , 由 于 当时 可 能 刚刚 坐 了 一 夜 火车 ， 
在 这 两 个 系统 上 来 回 倒 了 几 次 后 做 了 一 个 误 操 作 , 删除 了 一 张 重要 的 生产 表 的 数据 。 从 那 次 以 后 ， 
老 白 在 客户 现场 尽 可 能 避免 同时 连 到 多 个 系统 上 ， 以 避免 不 必要 的 误 操 作 。 

ssh (secure shell); 连接 ssh 的 服务 器 的 工具 ， 不 需要 老 白 做 过 多 解释 了 吧 。 如 果 你 觉得 这 个 
工具 太 土 ， 那 么 也 可 以 选择 SecureCRT。 

Xmanager: 这 个 臣 怕 不 用 说 了 ， 不 过 使 用 的 机 会 并 不 多 ， 主 要 是 在 做 数据 库 安装 和 升级 时 
使 用 。 

UltraEdit 也 是 老 白 重要 的 武器 , 其 最 大 优点 是 打开 的 文件 变化 时 能 够 捕捉 到 变化 ， 并 重新 更 
新 。 因 此 ， 老 白 经 常 使 用 UltraEdit 来 读 取 NetTerm 的 会 话 日 志文 件 。 

Cygwin; 一 个 可 以 在 Windows 下 模拟 Linux 的 软件 。 在 这 个 软件 里 ， 可 以 在 Windows 下 使 
用 Linux 的 命令 和 程序 ， 比 如 da、awk、gc++ 等 。 直 接 在 Windows 下 用 awk 调用 ass 分 析 系 统 状 
态 转 储 是 十 分 有 用 的 。 有 时 候 老 白 需要 写 个 简单 的 C 程序 ， 也 可 以 用 Cygwin 来 调试 。 

Wincvs: 它 是 著名 的 文档 版 本 管理 软件 CVS 的 Windows 版 本 ， 用 来 管理 文档 。 

Firefox+scrapbook: 老 白 的 知识 库 收集 工具 。 在 网 上 看 到 有 什么 好 的 文档 ， 立 即 拉 到 知识 
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E ffitilaI5) 通过 OEM 录像 采集 数据 


Oracle 9i 没有 ASH 的 功能 ， 因 此 不 能 进行 事后 的 事件 追踪 。 不 过 依赖 于 监控 软件 ， 可 以 实 
现 事后 回 斋 。 事 后 回调 对 于 分 析 问 题 十 分 关键 。 在 Oracle9i E, Mit OEM 的 图 表 录 像 可 以 实现 
这 个 功能 。 对 于 重点 时 间 段 采用 OEM 的 图 表 录 像 功 能 , 可 以 基本 上 记录 下 系统 状态 的 主要 方面 。 
今后 通过 图 表 的 回放 功能 ， 就 可 以 查看 某 个 时 段 的 系统 状态 。 

一 般 来 说 ， 如 果 要 做 性 能 调 优 ， 下 面 儿 个 图 表 是 十 分 重要 的 : 

a 系统 健康 性 图 表 (这 是 一 个 总 图 ， 可 以 看 到 系统 的 整体 情况 )， 
a 系统 响应 时 间 图 表 ; 

a VO 成 本 图 表 ; 

a 门 锁 汇 总 。 

使 用 图 表 录 像 功能 ， 建 议 使 用 OMS 服务 器 。 如 果 不 使 用 OMS 服务 器 ， 那 么 程序 一 旦 退出 ， 
录像 就 无 法 再 次 观看 了 。 因 为 Oracle 9i 的 OEM 客户 端 是 用 Java 写 的 ,很 容易 死 掉 ， 所 以 不 连接 
OMS 服务 器 ， 可 能 会 导致 录像 无 法 观看 。 

Oracle 工具 的 功能 确实 很 不 错 ， 不 过 用 户 界面 不 友好 是 顽疾 。Oracle 9i OEM 的 回 看 功能 只 
有 原 速 播放 和 快 进 两 种 模式 ， 不 能 拖拉 也 不 能 设 定 更 快速 度 的 快 进 。 如 果 录 像 很 长 的 话 ， 回 放 将 
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会 是 十 分 痛苦 的 事情 ， 因 此 建议 录像 的 长 度 不 要 太 长 。 我 曾经 尝试 过 在 一 个 10 小 时 的 录像 中 找 
20 分 钟 的 数据 ， 快 进 了 1.5 小 时 才 找 到 那 段 数据 。 看 完 一 遍 后 如 果 还 想 再 看 一 遍 ， 又 需要 再 快 进 
1.5 小 时 ， 而 不 能 后 退 。 由 于 OEM 存在 的 问题 , 在 回放 过 程 中 ， 如 果 看 到 什么 有 用 的 线索 , 一 定 
要 马上 通过 报告 功能 生成 一 份 报告 ， 这 样 就 不 需要 多 次 回放 来 查看 某 个 数据 了 。 


POKES) 调整 游标 相关 参数 


SQL 语句 分 析 分 为 软 分 析 和 硬 分 析 两 种 。 减少 软 分 析 和 硬 分 析 , 特别 是 减少 硬 分 析 ,， 对 于 降 
低 CPU 的 使 用 率 有 着 十 分 关键 的 作用 。 

一 般 来 说 ，SQL 分 析 和 应 用 软件 有 着 十 分 紧密 的 联系 。 优 化 应 用 软件 是 彻底 解决 SQL 分 析 
问题 的 最 佳 方法 。 但 是 在 数据 库 优 化 时 ， 往 往 很 难 对 应 用 软件 进行 彻底 优化 ， 因 此 通过 调整 系统 
参数 来 优化 SQL 分 析 是 DBA 经 常 面 临 的 问题 。 

SQL 执行 时 , 如 果 革 个 语句 已 经 是 会 话 缓冲 的 (在 会 话 的 游标 缓冲 区 中 存在 ) , 那么 这 个 SQL 
就 不 需要 进行 分 析 ， 可 以 直接 执行 ， 因 此 保证 SQL 能 够 在 缓冲 区 中 长 时 间 存 在 可 以 减少 SQL 分 
析 的 发 生 。 有 两 个 参数 可 以 控制 SQL 在 会 话 缓冲 池 中 的 时 间 长 短 : open cursors 和 
session cached cursors, open cursors 参数 控制 每 个 会 话 可 以 打开 的 游标 的 最 大 数量 ，; 
session cached cursors 控制 每 个 会 话 可 以 缓冲 的 游标 的 数量 。 在 Oracle 9iR2 之 前 ,往往 通 
过 open_cursors 来 控制 每 个 会 话 可 以 打开 的 游标 的 数量 , 从 Oracle 9i R2 开始 (特别 是 从 Oracle 
9.2.0.5 开始 ) ,通过 session cached cursors 的 会 话 缓冲 游标 机 制 可 以 使 会 话 尽 可 能 多 地 使 用 
被 缓冲 的 游标 ， 从 而 避免 SQL 被 重新 分 析 ， 这 样 可 以 大 大 降低 软 、 硬 分 析 的 数量 。 

在 设置 这 两 个 参数 时 ， 应 该 注意 session cached cursors 的 值 不 能 超过 open cursors 
的 值 。 在 Oracle 9i 中 ， 参 数 session cached cursors 的 默认 值 为 0， 将 其 设置 为 任何 大 于 零 
的 值 将 启动 Oracle 的 这 个 功能 (Oracle 10g 默认 开启 了 这 个 功能 )。 在 设置 session cached. 
cursors 参数 之 前 ， 首 先 要 确定 共享 了 地 的 大 小 是 否 足以 支持 缓冲 这 些 SQL。 因 为 session. 
cached cursors 是 针对 每 个 SESSION 的 ,所 以 对 于 拥有 几 百 甚至 上 千 个 SESSION 的 OLTP Z 
统 ， 设 置 session_cached cursors 时 要 十 分 注意 。 设 置 大 的 session_cached_cursors Z 
数 需要 比较 大 的 共享 池 来 支持 ， 如 果 调 整 了 这 个 参数 后 出 现 共享 池 空 间 不 足 的 情况 , 调整 共享 池 
的 大 小 或 者 减少 session cached cursors 参数 就 是 DBA 应 该 进行 的 操作 。 通 过 下 列 语句 ， 
可 以 检查 当前 参数 session cached cursors 和 open_cursors 的 情况 ， 根 据 查 询 结果 ， 可 以 
确定 如 何 调整 这 两 个 参数 ， 


SELECT 

'session cached cursors' parameter, 

lpad(value, 5) value, 

decode(value, 0, ' n/a', to char(100 * used / value, '990') || '$') usage 
FROM 

( SELECT 

max(s.value) used 
FROM 
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v$statname n, 
v$sesstat s 
WHERE 
n.name - 'session cursor cache count' and 
s.statistic# = n.statistic# 
), 
( SELECT 
value 
FROM 
vSparameter 
WHERE 
name = 'session_cached_cursors' 
) 
UNION ALL 
SELECT 
'open cursors', 
lpad(value, 5), 


to char(100 * used / value, '990') || '$' 
FROM 
( SELECT 
max(sum(s.value)) used 
FROM 


v$statname n, 
v$sesstat s 
WHERE 
n.name in ('opened cursors current', 'session cursor cache count') and 
s.statistic# = n.statistic# 
GROUP BY 
s.sid 
), 
( SELECT 
value 
FROM 
vSparameter 
WHERE 
name = 'open cursors' 
) 
/ 


在 上 述 查 询 中 ， 如 果 返 回 session cached cursors 缓冲 区 的 使 用 率 是 100% ， 那 么 说 明 
session cached cursors 参数 还 不 够 大 。 如 果 共 享 字 的 大 小 足够 ， 可 以 调整 该 参数 ， 直 到 使 
用 率 低 于 100% 为 止 。 

对 于 没有 使 用 绑 定 变量 的 系统 ， 如 果 cursor sharing W EJ exact, 那么 设置 session. 
cached cursors 时 要 十 分 注意 。 由 于 应 用 原因 ， 游 标的 重用 率 十 分 低 。 如 果 设 置 过 高 的 
session cached cursors, 会 导致 共享 池 空 间 被 大 量 占用 , 在 系统 负载 较 高 时 会 出 现 共 享 池 的 
性 能 问题 。 

另外 一 个 十 分 重要 的 问题 是 ，SQL ee sos Ride 如 果 某 个 系统 中 的 
SQL 分 析 带 来 的 开销 很 小 ， 比 如 只 有 1% ~ 5%， 那 么 需要 充分 考虑 我 们 是 否 很 必要 来 进行 优化 。 
因为 调整 游标 相关 的 参数 ， 可 能 带 来 共 Bu t 有 些 错误 的 调整 甚至 可 能 增加 宕 机 的 
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风险 。 我 曾经 碰 到 过 一 个 客户 ， 他 们 做 了 优化 后 ， 系 统 十 分 容易 宕 机 ， 宕 机 的 原因 是 ORA-4031, 
我 给 他 们 分 析 时 发 现 ， 他 们 上 次 优化 时 加 大 了 session_cached_cursors ， 同 时 将 
CURSOR SPACE FOR TIME 设置 为 true。 这 是 一 个 风险 十 分 大 的 调整 。 就 是 这 个 调整 导致 了 频 
繁 的 宕 机 ， 将 CURSOR SPACE FOR TIME 修改 为 false 后 ， 这 个 问题 就 解决 了 。 我 问 他 们 为 什 
么 做 这 个 调整 ， 他 们 的 回答 让 我 啼笑 皆 非 :“ 经 过 一 年 的 优化 ， 系 统 已 经 很 不 错 了 ， 只 有 SQL 软 
分 析 比 例 还 是 比较 高 ， 这 个 月 没 别 的 地 方 可 以 优化 的 了 ， 就 只 能 做 这 个 优化 了 。” 为 了 优化 而 优 
化 ， 这 种 教条 主义 往往 是 会 害 死人 的 。 


4 
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昨天 晚上 走 的 时 候 把 OEM 的 屏幕 录像 开 了 ， 所 以 今天 一 大 早 过 来 就 看 了 看 昨天 晚上 录制 的 
数据 , 快 进 了 半天 也 没 看 到 什么 特殊 的 东西 , 干脆 就 不 看 了 。 打 电话 问 了 几 个 昨天 晚上 做 账 务 处 
理 的 人 ， 大 家 都 说 比较 正常 ， 除 了 速度 比 上 个 月 更 慢 了 一 些 以 外 ,没有 性 能 下 降 特 别 多 的 模块 。 
账 务 处 理 的 速度 每 个 月 都 是 线性 下 降 的 ， 所 以 大 家 都 觉得 很 正常 ,并 没有 什么 特别 的 地 方 。 既 然 
大 家 都 没 觉 得 什么 ， 昨 天 晚上 录制 的 东西 也 就 懒得 去 看 了 。 不 过 看 录像 时 突然 发 现 ， 这 台 安 装 
OMS 服务 器 的 微机 速度 比 我 那 台 借 来 的 老 掉 牙 的 笔记 本 快 多 了 , 干脆 用 这 台电 脑 工 作 吧 ， 用 那 
台电 脑 起 码 降低 1/3 的 工作 效率 。 

优化 方案 基本 上 都 确定 了 , 剩 下 的 事情 老 于 他 们 在 做 细 化 , 细 化 工作 包括 整理 优化 实施 方案 
和 相关 的 脚本 。SQL 优化 的 工作 有 老 能 帮忙， 我 也 轻松 了 许多 。 前 面 几 批 提 交 的 三 四 十 个 SQL 
优化 方案 也 分 析 得 差不多 了 ， 大 部 分 都 已 经 由 张 工 转 发 给 了 开发 商 。 由 于 昨天 电脑 故障 , 今天 我 
主要 的 工作 还 是 在 现 有 的 电脑 上 安装 相关 的 工具 ， 复 制 相关 的 文件 。 

这 几 天 系统 虽然 负载 很 重 , 不 过 这 种 情况 已 经 持续 了 快 一 年 了 , 所 有 的 人 也 都 没有 感觉 什么 
不 适应 的 地 方 。 中 午 快 吃 午 饭 时 ， 张 工 突 然 打 电话 过 来 ， 说 他 们 那 边 有 一 个 数据 库 出 现 了 
ORA-4030 错误 。 由 于 那 套 系 统 并 不 在 我 们 合同 范围 之 内 ， 所 以 张 工 很 委婉 地 问 我 有 疫 有 时 间 ， 
帮 他 们 看 看 。 

今天 反正 事情 也 不 多 ,我 很 爽快 地 答应 了 下 来 。 使 用 张 工 给 我 的 账号 和 密码 登录 到 了 系统 里 ， 
发 现 报错 的 信息 是 : 


ORA-04030: out of process memory when trying to allocate 2097192 bytes (joxcx 
callheap,ioc allocate ufree) 
Current SQL statement for this session: 
call CRM OPER.oper(:1,:2) 
一 一 一 一 一 PL/SQL Call Stack ----- 
object line object 
handle number name 
c000000100da8108 0 package SYS.XMLNODECOVER 
c000000100dada80 381 package body SYS .XMLDOM 
c000000103a1d178 77 package body CRM.CRM OPER 


看 到 这 个 错误 信息 ， 首 先 我 查看 了 一 下 ulimit, 发现 ulimit 设置 很 正常 ， 全 部 是 
unlimited, 没有 可 能 导致 故障 的 设置 。 检查 物 理 内 存 的 使 用 情况 , 发 现 物理 内 存 还 有 一 些 空闲 ， 
虽然 不 是 很 多 , 不 过 也 还 是 有 300 多 焰 空间。 交换 区 的 使 用 率 相当 高 ,高 达 98%， 从 这 一 点 上 可 
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以 看 出 , 不 和 久 前 系统 曾经 出 现 过 十 分 严重 的 换 页 现象 . 从 调用 栈 中 可 以 看 出 , 这 是 CRM. CRM. OPER 
在 调用 xmldom 包 时 报错 。DOM 操作 是 十 分 消耗 内 存 的 ， 这 回报 错 的 是 一 次 申请 2MB 的 内 存 空 
间 。 看 到 DOM 操作 , 我 的 第 一 个 反应 就 是 ,是 不 是 dom 对 象 使 用 后 没有 释放 ? 看 样子 必须 分 析 
CRM OPER 的 代码 。 用 Toad 找到 了 这 个 存储 过 程 ， 幸 运 的 是 这 个 存储 过 程 并 没有 进行 WRAP, 
CRM OPER 代码 并 不 长 ， 主 要 是 生成 一 个 XML 数据 结构 ， 总 共 也 只 有 50 多 行 。 很 快 下 面 这 段 代 
码 引 起 了 我 的 注意 : 


parser := xmlparser.newParser; 

xmlparser.parseBuffer(parser,operInfo); 

doc := xmlparser.getDocument (parser); 
xmlparser.freeParser(parser); 


虽然 xmlparser 被 释放 了 ， 但 documentation 对 象 doc 并 没有 释放 。doc 是 一 个 dom 对 
象 ， 如 果 不 释 放 ，dom 对 和 象 所 占 的 空间 将 会 随 着 调用 的 增加 而 又 加 ， 最 终 导 致 物理 内 存 被 耗 尽 。 
为 了 证 实 这 个 猜测 ， 首 先 编 写 一 个 测试 程序 ， 具 体 如 下 : 


create or replace procedure oper is 








parser xmlparser.Parser; 
doc sys.xmldom.DOMDocument ; 
operInfo varchar2 (2000); 
i integer; 
begin 
operInfo:-'«?xml version-"1.0" standalone-"yes" ?>'; 


operInfo:-operInfo||'«QUERY LIST-'; 
operInfo:-operInfo||'«LIB NAME-"areasQueries" VER-"2.2.0.7.0" REP VER-"0.0" 
MIN INST VER-"2.1.0.4.1" INV LOC-"Queries21/areasQueries/2.2.0.7.0/areasQueries.jar"/»'; 
operInfo:=operInfo| | '</QUERY_LIST>'; 
i:=0; 

parser := xmlparser.newParser; 

xmlparser.parseBuffer (parser, operInfo) ; 

doc := xmlparser.getDocument (parser) ; 

xmlparser.freeParser (parser); 
-- xmldom.freeDocument (doc); 

i:=i+1; 

end; 

/ 


分 别 进行 两 次 测 K, 第 一 次 不 执行 xmldom. freeDocument (doc) ， 第 二 次 执行 xmldoc. 
freeDocument (doc), 。 通 过 下 面 的 方法 调用 


declare 
i integer; 
begin 
1:20; 
loop 
oper; 
i:zi-1; 
exit when i>100; 
end loop; 
end; 
/ 
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每 调用 一 次 ， 通 过 下 列 语句 检查 PGA 的 情况 : 


select value, n.name|| '('||s.statistic#||')' 
from v$sesstat s , v$statname n 
where s.statistic# = n.statistic# 
and n.name like '%ga memory$' 
and sid- «sid of problem session»; 


首先 进行 一 次 调用 freepocument 的 测试 , 查看 UGA fil PGA 的 使 用 情况 。 调 用 前 的 结果 是 : 








142476 session uga 
207940 session uga 
710024 session pga 
1037704 session pga 


第 一 次 执行 后 的 结果 为 : 


207940 session uga 
273404 session uga 
8165056 session pga 
8165056 session pga 


第 二 次 执行 后 的 结果 为 : 


207940 session uga 
273404 session uga 
7882672 session pga 
10734088 session pga 


memory (15) 
memory max(16) 
memory (20) 
memory max(21) 


memory (15) 
memory max(16) 
memory (20) 
memory max(21) 


memory (15) 
memory max(16) 
memory (20) 
memory max(21) 


可 以 看 出 ， 随 着 调用 次 数 的 增加 ，PGA 和 UGA 并 没有 明显 增长 。 下 面 修改 一 下 测试 程序 ， 
将 freeDocument 的 部 分 去 掉 。 没 执行 时 PGA 的 情况 为 : 





77012 session uga 
142476 session uga 
776488 session pga 
842024 session pga 


第 一 次 执行 后 的 结果 为 : 


142476 session uga 
207940 session uga 
5188024 session pga 
5253560 session pga 


第 二 次 执行 后 的 结果 为 : 


142476 session uga 
207940 session uga 
5126608 session pga 
5253560 session pga 


memory (15) 
memory max(16) 
memory (20) 
memory max(21) 


memory (15) 
memory max(16) 
memory (20) 
memory max(21) 


memory (15) 
memory max(16) 
memory (20) 
memory max(21) 
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通过 Windows 任务 管理 器 观察 Oracle 进程 的 物理 内 存 情况 ， 可 以 得 出 类 似 的 结果 。 如 果 释 
Tit dom 对 象 , PGA 内 存 不 会 持续 增长 ; 如果 不 释放 dom 对 象 , PGA 内 存 会 越 占 越 多 。 通过 Windows 
任务 管理 器 可 以 看 出 , 执行 200 次 存储 过 程 ，Oracle 进程 的 内 存 使 用 增加 了 200MB。 从 上 述 测 试 
中 可 以 得 出 ， 由 于 没有 释放 document 对 象 ， 导 致 了 内 存 泄漏 。 我 把 这 个 结果 告诉 了 张 工 ， 他 和 
开发 人 员 确 认 了 一 下 , 确认 这 个 模块 是 昨天 下 午 才 上 线 的 一 个 应 用 调用 的 , 程序 员 也 确认 不 释放 
document 对 象 是 错误 的 。 
处 理 完 这 个 小 故障 ， 已 经 是 中 午 12:30 了 。 办 公 室 里 除了 老 于 其 他 人 都 去 吃饭 了 。 我 急忙 
锁 了 屏幕 ， 和 老 于 下 楼 去 吃饭 。 中 午 吃 饭 时 ， 老 于 一 直 比 较 沉 默 ， 我 问 他 是 不 是 有 什么 心事 。 他 
说 有 点 想 家 ， 老 于 家 就 是 锦州 的 ， 原 计划 这 周末 回 家 休息 一 下 ,， 由 于 6 日 要 做 实施 ， 这 个 计划 只 
能 泡汤 了 。 做 DBA 的 , 很 多 像 老 于 那样 ,一 年 到 头 没 有 多 长 时 间 能 够 和 家 里 人 团聚。 有 时 想 想 ， 
对 家 人 亏欠 确实 很 多 。 


X spam 


关于 ORA-4030 的 分 析 ，Metalink 上 有 几 份 文档 很 具有 参考 价值 。 

Note:116076.1 Tackling ORA-4030 on Windows NT, 

Note:233869.1 Diagnosing and Resolving ORA-4030 Errors, 

Note:199746.1 How to Resolve ORA-4030 Errors on UNIX, 

Note:395800.1 Things to Know about Error ORA-4030 in AIX Environments, 

Note:373602.1 How to Avoid ORA-04030/ORA-12500 in 32 Bit Windows Environment, 
Note:46001.1 Oracle Database and the Windows NT Memory Architecture, Technical Bulletin, 
Note:399497.1 FAQ: ORA-4030, 

Note:278310.1 ORA-4030 with Parallel Queries, 
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P 人 优化 小 技巧 ) 如何 分 析 ORA-4030 


ORA-4030 一 般 来 说 是 进程 从 操作 系统 申请 内 存 时 操作 系统 无 法 分 配 内 存 所 致 。 一 般 来 说 ， 
ORA-4030 可 能 由 儿 方 面 原因 引起 : 操作 系统 无 法 从 物理 内 存 和 交换 区 (交换 区 ) 分 配 内 存 给 进 
fe. 或 者 进程 受到 了 操作 系统 的 某 个 限制 条 件 的 约束 无 法 分 配 更 多 内 存 ， 还 有 就 是 碰 到 了 某 个 
Oracle 的 bug。 

遇 到 ORA-4030 时 ,首先 我 们 要 检查 的 是 操作 系统 的 物理 内 存 和 交换 区 是 否 满 了 。 如 果 物 理 
内 存 所 剩 无 几 ， 并 且 交 换 区 接近 或 者 达到 100%， 那 么 就 是 真正 的 内 存 不 足 了 。 一般 情况 下 ， 这 
种 现象 出 现 的 较 少 ， 大 多 数 ORA-4030 是 由 进程 或 者 操作 系统 参数 限制 引起 。 

如 果 发 现 物理 内 存 还 有 很 多 剩余 , 那么 下 一 步 需 要 检查 的 是 Oracle 账户 的 ulimit 参数 。 比如: 


SUN OS: 
/tmp/oralog»»» ulimit -a 
time(seconds) unlimited 
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file(blocks) unlimited 

data (kbytes) unlimited 

stack (kbytes) 8192 

coredump (blocks) unlimited 

nofiles(descriptors) 256 

vmemory (kbytes) unlimited 

HP-UX: 

$[/oracle]ulimit -a 

time (seconds) unlimited 

file(blocks) unlimited 

data (kbytes) 1048576 

stack (kbytes) 131072 

memory (kbytes) unlimited 

coredump (blocks) 4194303 

nofiles(descriptors) 2048 

AIX: 

[/home/oracle9i]#ulimit -a 

time (seconds) unlimited 

file(blocks) unlimited 

data (kbytes) unlimited 

stack (kbytes) 65536 

memory (kbytes) unlimited 

coredump (blocks) 2097151 

nofiles(descriptors) unlimited 
其 中 的 data, stack, memory 等 参数 过 小 都 可 能 引起 ORA-4030。 一 般 来 说 ， 建 议 将 这 些 参 数 
设置 为 -1 (unlimited)。 如 果 ulimit 参数 没有 问题 , 那么 也 可 能 是 其 他 操作 系统 内 核 参 数 引 起 


的 。 我 们 可 以 使 用 下 面 的 程序 去 测试 一 下 一 个 进程 能 够 分 配 到 的 物理 内 存 的 大 小 : 


/* mem.c */ 
#include <stdio.h> 
#include <errno.h> 


main() 


{ 


long int i; 


i = iş; 
for(;; 


( 


if (!malloc(1048576)) 


{ 


printf("malloc failed with error: %u at iteration %u\n", 
exit( 


) 


i++; 


-1); 


printf("allocated $u M of memory\n", i); 


Lf (i 


*1048576) >= 500000000) { 


printf ("Leaving...\n"); 
exit(0); 


} 
} 


errno,i); 
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上 面 的 程序 来 自 于 Metalink 文档 395800.1。 一 般 来 说 ， 操 作 系统 下 都 有 C 编译 器 ， 直 接 编 
fi mem.c， 然 后 编译 执行 一 下 就 可 以 了 。 

对 于 32 位 操作 系统 , 由 于 操作 系统 寻 址 的 关系 , 物理 内 存 是 受到 一 定 限 制 的 , 比如 Windows 
操作 系统 每 个 进程 能 够 使 用 的 物理 内 存 寻 址 空间 是 2GB (32 位 的 最 高 限制 )。 而 在 Windows T, 
Oracle 是 使 用 多 线程 模式 的 , 所 有 的 Oracle 会 话 使 用 相同 的 进程 空间 , 因此 在 Windows F, SGA 
和 会 话 使 用 的 总 内 存 不 能 超过 2GB。 

另外 ， 还 有 很 多 bug 会 导致 ORA-4030, Metalink 文档 399497.1 里 面 有 很 详细 的 介绍 。 这 里 
篇 幅 有 限 ， 就 不 做 详细 介绍 了 。 
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E: 


今天 是 原 定 的 优化 方案 的 提交 日 期 。 早 上 一 到 办 公 室 ， 老 于 就 打 电 话 给 张 工 ， 和 希望 今天 能 够 
和 开发 商 一 起 讨论 一 下 优化 方案 。 张 工 和 开发 商 联系 后 反馈 回来 的 结果 是 ,开发 商 这 边 没 有 专职 
的 DBA， 因 此 无 法 对 优化 方案 进行 评审 。 这 种 情况 下 ， 方案 评审 就 只 能 是 我 们 和 甲 方 一 起 做 了 。 
这 样 就 变 成 了 我 们 向 张 工 他 们 介绍 6 日 要 做 的 事情 ,也 就 没 必 要 到 总 部 去 搞 正式 会 议 了 。 方案 评 
审 就 约 在 我 们 办 公 的 地 方 ， 时 间 是 下 午 2 : 30, 

原本 以 为 在 我 们 办 公 室 做 的 方案 研讨 实际 上 是 走过场 ， 但 下 午 的 方案 讨论 会 开 得 并 不 轻松 。 
我 们 准备 了 详细 的 优化 方案 ， 每 个 步骤 都 写 得 十 分 清晰 。 优 化 实施 从 晚上 10 : 00 开始 ， 预 计 到 
凌晨 4 : 00 结 束 ， 耗 时 6 个 小 时 。 如 果 出 现 问 题 ， 回 退 点 设置 为 凌晨 5 : 00。 不 过 客户 对 每 个 步 
又 都 提出 了 疑问 。 我 们 只 是 设 定 了 一 个 操作 窗口 ,但 是 并 没有 将 每 一 个 操作 步骤 的 耗 时 明确 列 出 。 
比如 我 们 的 操作 中 涉及 对 几 张 表 做 分 区 , 对 这 几 张 表 做 分 区 需要 多 长 时 间 ? 准备 串 行 操作 还 是 并 
行 操作 ? 

说 实在 的 ， 由 于 没有 进行 严格 的 测试 , 我 对 一 些 时 间 点 也 只 能 进行 估算 , 无 法 得 到 一 个 很 明 
确 的 时 间 。 这 个 问题 讨论 了 很 久 , 最 后 我 建议 今天 晚上 做 一 个 类 似 的 模拟 测试 , 把 时 间 估 算 准 确 ， 
然后 再 修改 一 下 这 个 方案 。 张 工 同意 了 这 个 方案 , 并 且 帮 我 们 联系 了 现场 运 维 人 员 ， 临时 加 了 一 
个 40GB 的 表 空 间 给 我 们 使 用 。 方 案 的 其 他 部 分 没有 什么 疑问 ， 很 快 就 得 到 了 确认 。 对 于 保障 和 
回 退 方面 的 问题 ,由 于 整个 实施 过 程 的 基调 就 是 可 迅速 回 退 , 完善 的 操作 性 极 强 的 回 退 方案 得 到 
了 客户 的 认可 。 

由 于 晚上 要 做 测试 ， 所 以 大 家 都 没有 回去 ,晚饭 是 在 对 面 的 “北方 大 厦 ” 吃 的 ， 也 就 是 我 们 
中 午 常 去 吃 自助 餐 的 那个 地 方 。 晚 餐 价格 和 中 午 一 样 , 不 过 伙食 比较 差 .好像 是 把 中 午 的 残 姜 冷 
条 加 热 了 一 下 。 吃 饭 的 时 候 ， 大 家 都 对 6 月 6 日 的 优化 表示 了 强烈 的 信心 。 通 过 这 半 个 多 月 的 工 
作 , 特别 是 这 几 天 对 优化 方案 的 分 析 ， 对 目前 系统 的 情况 已 经 了 如 指 掌 了 ,这 次 优化 能 够 提升 的 
性 能 也 不 是 我 们 以 前 在 会 议 上 承诺 的 20% 左 右 , 按照 保守 估计 , 这 次 优化 后 系统 性 能 应 该 能 够 提 
升 30% 以 上 。 实 际 上 ， 目 前 除了 SQL 优化 无 法 控制 外 ， 其 他 方面 一 切 尽 在 掌握 中 。 如 果 开 发 商 
能 够 配合 得 好 一 点 ， 优 化 完成 时 系统 性 能 翻番 是 不 成 问题 的 。 不 过 从 目前 客户 的 情况 来 看 ， 他 们 
要 求 的 不 仅仅 是 数据 上 30% 的 提升 ， 而 是 彻底 解决 目前 的 问题 ,使 系统 能 在 两 年 内 稳定 运行 , 直 
到 退 网 。 

晚上 的 测试 是 要 验证 一 下 表 分 区 操作 所 需要 的 时 间 是 不 是 和 我 们 预期 的 一 致 。 我 们 找 了 一 张 
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10GB 左右 的 表 ， 首 先 在 一 个 测试 账号 下 面 创建 了 另 一 张 测试 表 ， 然 后 从 这 张 表 中 复制 数据 。 为 
了 防止 undo 表 空 间 不 足 ， 我 们 采用 了 串 行 方式 ， 每 次 复制 一 个 分 区 的 数据 ， 数 据 全 部 复制 完毕 
后 再 创建 索引 。 这 张 10GB 的 表 总 计 耗 时 70 分 钟 才 重建 完成 。 按 照 这 种 速度 ， 是 无 法 在 5 个 小 
时 内 完成 所 有 分 区 表 的 操作 的 ， 因 此 我 们 需要 使 用 并 行 方式 。 并 行 方式 的 测试 结果 还 不 错 ， 整 个 
操作 在 50 分 钟 内 完成 了 。 为 了 提高 创建 索引 的 性 能 , 我 们 把 PGA_AGGREGATE_TARGET 加 大 了 一 
倍 。 通 过 评估 ， 即 使 使 用 并 行 操作 ，6 小 时 的 维护 窗口 也 存在 较 大 的 风险 。 

这 样 的 话 我 们 的 优化 实施 无 法 在 一 个 晚上 完成 , 分 成 两 个 晚上 。 连续 两 个 晚上 对 同一 套数 据 
库 实 施 停 机 操作 ， 客 户 方面 也 无 法 承受 。 采 用 两 张 表 并 行 操作 ， 从 测试 结果 来 看 ,效果 不 佳 。 上 
述 的 测试 和 我 们 预 估 存 在 的 差异 较 大 , 主要 是 客户 的 硬件 确实 比较 差 , 能 挖 的 潜力 都 已 经 被 我 们 
挖 得 差不多 了 。 测试 陷 入 了 困境 , 没 想到 大 家 认为 天 衣 无 颖 的 优化 方案 , 居然 存在 这 么 大 的 一 个 
问题 。 和 客户 一 起 讨论 了 一 下 ， 张 工 的 意见 是 如 果 不 行 就 分 为 两 天 实施 ， 他 去 和 业务 部 门 协调 。 
不 过 哪怕 客户 同意 两 天 实施 一 套 系统 , 那么 整个 实施 过 程 需要 整整 一 个 星期 , 时 间 上 也 有 点 无 法 
































接受 。 如 果 一 个 晚上 搞 两 套 系 统 ， 又 怕 影 响 面 太 大 ， 不 好 控制 ， 一 旦 出 现 问题 ， 将 很 难 协调 。 大 
家 都 陷入 了 两 难 的 境地 。 





通过 激烈 的 讨论 ， 最 后 终于 拿 出 了 一 个 方案 。 这 个 方案 只 有 两 点 : 一 是 向 局 方 申请 的 停机 窗 
FAM 8 : 00 开始 ， 到 第 二 天 凌晨 5 : 00 结 束 ， 这 样 我 们 就 有 9 个 小 时 的 维护 窗口 ; 二 是 除了 要 分 
区 的 几 张 表 ， 表 分 析 操 作 提 前 到 6 日 下 午 开始 ， 争 取 在 8 : 00 实施 之 前 全 部 做 完 。 

按照 这 个 思路 重新 排 了 一 下 实施 方案 。 如 果 一 切 顺利 的 话 , 我 们 将 可 以 在 凌晨 2 : 00 之 前 完 
成 所 有 的 优化 工作 。 我 们 的 停机 窗口 里 有 3 个 小 时 的 机 动 时 间 ,， 这 样 就 有 了 足够 的 保障 。 而 且 如 
果 到 5 : 00 优化 无 法 完全 完成 的 话 ， 离 开始 营业 还 有 3 个 半 小 时 。 我 们 有 充分 的 时 间 去 执行 回 退 
预案 。 

最 终 的 方案 得 到 了 张 工 的 认可 。 明 天 我 们 把 方案 修改 完毕 , 然后 提交 给 张 工 ,这 个 工作 就 算 
完成 了 ， 下 一 步 就 看 6 月 6 日 了 。 


X spa 





今天 老 白 他 们 在 做 优化 实施 方案 。 一 个 好 的 实施 方案 是 十 分 重要 的 , 老 白 参加 过 无 数 次 实施 ， 
也 有 很 多 经 验 和 教训 。 每 次 失败 的 实施 都 和 优化 实施 方案 准备 不 足 有 关 , 哪怕 是 很 简单 的 实施 操 
作 ， 如 果 在 前 期 方案 准备 时 不 充分 ， 也 可 能 出 问题 。 对 于 十 分 重要 的 实施 操作 ， 在 有 条 件 的 情况 
下 ， 尽 可 能 找 个 测试 环境 进行 一 下 测试 ， 找 到 方案 中 可 能 存在 的 不 足 。 

如 果 没 有 条 件 搭建 测试 环境 , 那么 实施 方案 的 评审 工作 更 为 重要 , 最 好 能 够 让 开发 人 员 也 参 
与 评审 工作 。 因 为 DBA 可 能 对 应 用 的 情况 不 是 十 分 了 解 ， 开 发 人 员 的 参与 可 以 从 另外 一 个 角度 
提出 一 些 建 议 。 今天 老 白 他 们 没有 得 到 开发 人 员 的 支持 , 这 是 十 分 遗憾 的 ， 因 此 老 白 和 老 于 决定 
做 一 次 实际 的 测试 。 虽然 没 有 测试 环境 , 但 是 晚上 在 生产 环境 做 一 个 测试 也 是 无 奈 之 举 。 冬 运 的 
是 ， 从 测试 中 发 现 了 很 多 问题 ， 最 终 调整 了 优化 实施 方案 。 如 果 到 了 6 H 6 日 再 出 现 这 个 问题 ， 
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那么 老 白 他 们 只 能 进行 回 退 了 。 在 优化 项 目 中 , 回 退 是 很 难 接受 的 结果 ， 可 能 会 导致 客户 对 优化 
团队 失去 信心 ， 要 尽量 避免 。 

另外 ， 关 于 停机 窗口 的 选择 ， 也 是 一 个 十 分 重要 的 问题 。 经 验 不 足 的 DBA 往往 在 设计 停机 
窗口 时 过 于 轻率 ， 由 于 没有 对 实施 计划 进行 很 好 的 设计 ,往往 对 可 能 出 现 的 问题 估计 不 足 ， 所 以 
在 实际 实施 过 程 中 ， 往 往 由 于 某 些 突 发 事件 而 手忙脚乱 。 有 经 验 的 DBA 往往 会 给 自己 留 有 足够 
的 余 量 ， 尽 可 能 让 自己 获得 更 多 的 资源 支持 。 记 得 有 一 次 做 一 个 RAC 添加 市 点 的 项 目 ， 按 照 设 
计 的 预案 是 不 需要 停 数据 库 的 ， 不 过 为 了 保险 起 见 ， 我 还 是 向 客户 申请 了 4 个 小 时 的 停机 窗口 。 
刚刚 开始 时 进展 都 很 顺利 ， 基 至 客户 都 开始 嘲笑 我 过 于 神经 过 敏 了 。 这 个 时 候 突 然 出 了 一 个 
ORA-600， 必 须 停 数据 库 打 补丁 。 如 果 当 时 我 们 没有 申请 停机 窗口 ， 那 将 是 一 次 事故 ， 而 由 于 提 
前 做 了 申请 ， 事 故 就 被 避免 了 。 


E 之 优化 小 技巧 ) 一 个 提供 参考 的 优化 方案 


ALE DBA 觉得 优化 方案 是 十 分 神秘 的 东西 ， 总 觉得 优化 方案 里 应 该 包含 一 些 不 为 人 知 的 高 
深 的 东西 。 而 事实 上 ,一 个 能 解决 问题 的 优化 方案 才 是 最 好 的 优化 方案 ， 而 能 解决 问题 的 优化 方 
案 往往 都 是 朴实 无 华 的 ， 其 中 大 多 数 技术 都 是 我 们 平时 耳熟能详 的 东西 。 比 如 ,我 们 针对 这 个 项 
目 提出 的 优化 方案 包括 操作 系统 优化 和 数据 库 优 化 两 个 部 分 。 

其 中 操作 系统 优化 包括 : 

口 将 maxclient% 从 80 调整 为 20; 
O 将 maxpermsgs 从 80 调整 为 20; 

口 将 minperm% 调 整 为 10, 
数据 库 参 数 调整 包括 : 

口 设置 lock_sga=true; 

a 加 大 共享 池 ; 

口 加 大 pga_aggregate_target; 
口 加 大 DB Cache; 


设置 session cached cursors; 











e, cursor sharing-similar; 
增加 do writer processes; 
减少 large pool size; 

减少 java pool size; 

加 大 1og buffer; 

重 做 日 志文 件 调整 包括 : 

O 将 重 做 日 志文 件 大 小 加 大 为 1GB; 
a 增加 重 做 日 志 组 的 数量 ; 

表 空 间 调整 包括 ; 
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a 临时 表 空 间 增加 4 个 大 小 为 2GB 的 临时 文件 ， 
其 他 调整 包括 : 

a 将 部 分 PL/SQL 对 象 缓 存 到 共享 池 ， 

a 分 析 所 有 的 表 和 索引 。 


SREI) 游标 的 共享 


= 








在 优化 方案 里 提 到 了 两 个 参数 的 调整 ,就 是 cursor sharing 和 session_cached_cursors, 


这 两 个 参数 都 是 和 游标 共享 有 关 的 。Oracle 的 目的 就 是 让 一 个 游标 可 以 分 析 一 次 ,执行 多 次 。 


此 将 游标 的 可 共享 部 分 存放 在 库 缓冲 (library cache) 里 。 





Oracle 判断 游标 共享 的 第 一 个 原则 是 ， 可 共享 的 游标 的 SQL 文本 必须 完全 相同 。 游 标 在 执 





行 前 ， 首 先 对 其 文本 计算 散 列 值 ， 通 过 散 列 值 找到 相同 的 游标 。 如 果 找 到 了 相同 的 游标 


， 而 且 该 


游标 的 所 有 对 象 (包括 subheap) 都 是 有 效 的 ， 那 么 这 个 游标 在 执行 时 ， 可 以 使 用 共享 的 SQL, 
如 果 某 些 对 象 已 经 被 换 出 ， 那 么 这 个 游标 就 需要 进行 软 分 析 ， 将 丢失 的 部 分 补充 完整 才能 执行 。 
如 果 SQL 文本 完全 相同 ,是 不 是 就 能 够 共享 呢 ? 实际 上 还 是 不 行 的 ,比如 有 SCOTT 和 TIGER 
这 两 个 用 户 ， 下 面 都 有 test 表 ， 如 果 在 这 两 个 用 户 下 都 执行 SELECT 1 FROM tt WHERE rownum 
<2， 而 这 两 个 SQL 访问 的 表 是 不 同 的 ， 那 么 这 两 个 SQL 是 不 应 该 共享 的 。Oracle 在 这 种 情况 下 











是 怎么 处 理 的 呢 ? 首先 ， 由 于 SQL 文本 完全 相同 ， 所 以 这 两 个 SQL 具有 相同 的 sor, n 


D 和 散 列 








值 ， 被 认为 是 相同 的 SQL， 在 v$salarea 下 可 以 看 到 如 下 结果 : 





SOL ID ADDRESS SQL TEXT VERSION COUNT 
cpjnybv7021rv 1F7059E0 SELECT 1 FROM tt WHERE rownum<2 2 
在 v$sql 中 可 以 看 到 如 下 结果 : 

SOL ID ADDRESS SOL TEXT 

cpjnybv7021rv 1F7059E0 SELECT 1 FROM tt WHERE rownum<2 
cpjnybv7021rv 1F7059E0 SELECT 1 FROM tt WHERE rownum<2 


可 以 看 出 ， 这 两 个 SQL 被 认为 是 同一 个 SQL， 但 是 cpjnybv7021rv 包含 两 个 子 游 标 。 为 


什么 会 产生 两 个 子 游标 呢 ? 通过 vssql_shared_cursor， 可 以 看 到 : 


SQL> SELECT sql id,address,child address,child number,translation mismatch 
2 v$sql shared cursor WHERE sql id-'cpjnybv7021rv'; 





SOL ID ADDRESS CHILD AD CHILD NUMBER T 
cpjnybv7021rv 1F7059E0 231974B8 ON 
cpjnybv7021rv 1F7059E0 232BC270 AX 


FROM 


第 一 个 子 游标 在 这 个 视图 中 所 有 的 mismatch 都 是 N， 第 二 个 SQL 是 由 translation 
mismatch 而 导致 不 能 共享 , 其 原因 是 在 做 事务 时 发 现 相关 的 对 象 不 同 。 通过 库 Cache DUMP £i: 


BUCKET 67323: 
LIBRARY OBJECT HANDLE: handle-1f7059e0 mutex-1F705A94(2) 
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name-SELECT 1 FROM tt WHERE rownum<2 
hash-1cd693ce0a964189cac69e5ece0106fb timestamp-12-11-2007 16:18:05 
namespace=CRSR flags=RON/KGHP/TIM/KEP/PNO/SML/KST/DBN/MTX/ [12010084] 
kkkk-dddd-1111=0001-0001-0001 lock=0 pin=0 latch#=3 hpc=0000 hlc=0000 
lwt=1F705A3C[1F705A3C,1F705A3C] ltm-1F705A44[1F705A44,1F705A44] 
pwt=1F705A20[1F705A20,1F705A20] ptm-1F705A28[1F705A28,1F705A28] 
ref-1F705A5C[1F705A5C,1F705A5C] 1Ind=1F705A68 [232C803C,1F705164] 

DEPENDENCY REFERENCES: 

reference latch flags 








206b0c68 0 [60] 
20642c5c 0 [60] 
LIBRARY OBJECT: object=206b138c 
type=CRSR flags=EXS[0001] pflags=[0000] status=VALD load=0 
CHILDREN: size=16 
child# table reference handle 
0 20651318 206b0fcc 231974b8 
1 206b1318 206b112c 232bc270 
DATA BLOCKS: 
data# heap pointer 
0 2316d4bc 206b1424 I/P/A/-/- 0 NONE 00 
BUCKET 67323 total object count=1 


status pins change whr 


这 个 父 游标 包含 两 个 子 游标 ， 其 中 一 个 是 231974b8。 下 面 我 们 来 看 看 这 个 游标 : 


LIBRARY OBJECT HANDLE: handle=231974b8 mutex-2319756C(0) 
namespace-CRSR flags=RON/KGHP/PNO/ [10010000] 
kkkk-dddd-1111=0000-0041-0041 lock=0 pin=0 latch#=3 hpc=0000 hlc=0000 


lwt=23197514 [23197514, 23197514] 
pwt-231974F8[231974F8,231974F8] 
ref-23197534[206BOFCC, 206BOFCC] 
CHILD REFERENCES: 
reference latch flags 


1tm-2319751C[2319751C,2319751C] 
ptm-23197500[23197500,23197500] 
1nd-23197540[23197540,23197540] 





206b0fcc 0 CHL[02] 
LIBRARY OBJECT: object=206b0b2 


c 


type-CRSR flags-EXS[0001] pflags-[0000] status=VALD load=0 


DEPENDENCIES: count-1 size-16 
dependency# 


0 20759070 


table reference 


20758d70 230c63b8 


handle position flags 


READ ONLY DEPENDENCIES: count=1 size=16 


dependency# 
0 206b0ee8 206b0c68 
ACCESSES: count=1 size=16 
dependency# types 
0 0009 
TRANSLATIONS: count=1 size=16 
original final 


table reference 


handle flags 


1£7059e0 /ROD/KPP[60] 


192 Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





230c63b8 230c63b8 
DATA BLOCKS : 


data# heap pointer status pins change whr 
0 23202038 206b0c7c I/-/A/-/- 0 NONE 00 
6 20758ca4 201a185c I/-/A/-/- 0 NONE 00 


下 面 来 看 看 230c63b8 对 应 的 对 象 : 


BUCKET 99929: 
LIBRARY OBJECT HANDLE: handle=230c63b8 mutex=230C646C(0) 
name-SCOTT.TT 
hash-dcfddf221c9799c3b07c3d16af4b8659 timestamp-12-11-2007 16:16:45 
namespace-TABL flags=KGHP/TIM/SML/ [02000000] 
kkkk-dddd-1111=0000-0701-0701 lock=N pin=0 latch#=1 hpc=0002 hlc=0002 
1wt-230C6414[230C6414,230C6414] ltm=230C641C[230C641C, 230C641C] 
pwt-230C63F8[230C63F8,230C63F8] ptm-230C6400[230C6400,230C6400] 
ref=230C6434 [230C6434,230C6434] 1nd-230C6440[232B9660,1F6575D8] 
DEPENDENCY REFERENCES: 
reference latch flags 


20478ce0 2 DEP[01] 
20758870 0 DEP[01] 
LOCK OWNERS: 
lock user session count mode flags 
20f9e5e4 2373238c 23733654 ON [4000] 
20fc86cc 2373238c 2373238c ON [4000] 


LIBRARY OBJECT: object=20758884 
type=TABL flags=EXS/LOC[0005] pflags=[0000] status=VALD load=0 
DATA BLOCKS: 


data# heap pointer status pins change whr 
0 2324da64 2075891c I/-/A/-/- 0 NONE 00 
8 20758aac 20657298 I/-/A/-/- 0 NONE 00 
9 20758b44 204cf62c I/-/A/-/- 0 NONE 00 
10 20758b94 2073e4e0 I/-/A/-/- 0 NONE 00 


BUCKET 99929 total object count-1 


再 来 看 看 第 二 个 子 游标 ， 即 232bc270: 


LIBRARY OBJECT HANDLE: handle=232bc270 mutex=232BC324(0) 
namespace=CRSR flags=RON/KGHP/PNO/ [10010000] 
kkkk-dddd-1111=0000-0041-0041 lock=0 pin=0 latch#=3 hpc=0000 hlc=0000 
lwt=232BC2CC[232BC2CC,232BC2CC] 1tm-232BC2D4[232BC2D4,232BC2D4] 
pwt=232BC2B0 [232BC2B0,232BC2B0] ptm=232BC2B8 [232BC2B8, 232BC2B8] 
ref-232BC2EC[206B112C,206B112C] Ind=232BC2F8 [232BC2F8 , 232BC2F8] 

CHILD REFERENCES: 
reference latch flags 
206b112c 0 CHL[02] 
LIBRARY OBJECT: object=20642b20 
type-CRSR flags=EXS[0001] pflags=[0000] status-VALD load=0 
DEPENDENCIES: count=1 size=16 
dependency# table reference handle position flags 
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0 2059d22c 2059cf2c 1£708c18 14 DEP[01] 
READ ONLY DEPENDENCIES: count-1 size-16 
dependency# table reference handle flags 
看 看 1£708c18 对 应 的 对 象 : 


BUCKET 68671: 
LIBRARY OBJECT HANDLE: handle-1f708c18 mutex-1F708CCC(0) 
name-T2.TT 
hash-b6efdd23a914ea2eal1b8ffeb7d170c3f timestamp-12-11-2007 16:16:15 
namespace-TABL flags=KGHP/TIM/SML/ [02000000] 
kkkk-dddd-1111=0000-0701-0701 lock=N pin=0 latch#=2 hpc=0002 hlc=0002 
lwt=1F708C74[1F708C74,1F708C74] ltm-1F708C7C[1F708C7C,1F708C7C] 
pwt-1F708C58[1F708C58,1F708C58] ptm-1F708C60[1F708C60,1F708C60] 
ref-1F708C94[1F708C94,1F708C94] I1nd-1F708CA0[1F705910,1F708B48] 
DEPENDENCY REFERENCES: 
reference latch flags 





207a6154 2 DEP[01] 
2059cf2c 0 DEP[01] 
LOCK OWNERS: 
lock user session count mode flags 
2125a5dc 2373491c 23733654 ON [4000] 
212345d0 2373491c 2373491c ON [4000] 


LIBRARY OBJECT: object=2059ca40 
type=TABL flags=EXS/LOC[0005] pflags=[0000] status=VALD load=0 
DATA BLOCKS: 


data# heap pointer status pins change whr 
0 2324abc0 2059cad8 I/-/A/-/- 0 NONE 00 
8 2059cc68 2059c8fc I/-/A/-/- 0 NONE 00 
9 2059cd00 2059c10c I/-/A/-/- 0 NONE 00 
10 2059cd50 2059bd14 I/-/A/-/- 0 NONE 00 


BUCKET 68671 total object count-1 

除了 这 种 情况 ， 还 有 哪些 不 可 共享 的 原因 呢 ? A v$sal shared cursor 中 就 可 以 看 出 
mismatch 的 各 种 原因 。 

另外 一 种 典型 的 SQL 不 能 共享 的 条 件 是 两 个 SQL 的 执行 计划 不 同 。 如 果 两 个 SQL 相同 , 但 
是 由 于 参数 不 同 ， 必 须 使 用 不 同 的 执行 计划 ， 那 么 这 种 SQL 最 好 还 是 不 要 共享 。 因 为 SQL 共享 
带 来 的 好 处 可 能 只 是 执行 了 错误 的 执行 计划 的 几 百 分 之 一 。 从 这 方面 来 看 , 我们 也 不 能 片面 地 强 
调 SQL 共享， 而 忽略 了 由 于 SQL 共享 带 来 的 问题 。 

举 个 简单 的 例子 ， 比 如 ca 表 有 个 字段 是 STATUS, Herp 99% 的 值 都 是 END, RA 1% 的 值 是 
BEGIN。 我 们 的 大 多 数 程序 都 是 每 次 读 取 值 为 STATUS='BEGIN' 的 行 ， 然 后 处 理 ， 处 理 结束 后 设 
置 STATUS='END'， 只 有 少量 的 统计 操作 需要 查询 STATUS=' END ' 的 行 的 数量 ， 这 种 情况 下 如 果 
使 用 柱状 图 ,优化 器 就 能 使 用 合理 的 执行 计划 ， 因 此 这 种 情况 下 不 能 使 用 绑 定 变量 。 如 果 使 用 了 
绑 定 变 量 ， 那 么 如 果 是 早期 版 本 ， 优 化 器 不 会 使 用 柱状 图 ， 而 使 用 默认 的 选择 性 值 来 判断 。 如 果 


Jj 
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是 Oracle 9i 或 者 以 后 版 本 的 数据 库 ， 绑 定 变 量 帘 视 (bind value peeking) 技术 可 以 通过 使 用 柱状 
图 来 选择 较 好 的 执行 计划 。 但 是 绑 定 变量 宽 视 只 是 在 SQL 第 一 次 被 执行 、 执 行 硬 分 析 时 进行 
后 面 的 所 有 SQL 由 于 使 用 了 绑 定 变量 ， 会 被 认为 是 REW, PRTA. XA SQL «TR etn 
种 执行 计划 ， 走 索引 或 者 全 表 扫 描 。 而 选择 哪 种 执行 计划 ， 完 全 取决 于 做 硬 分 析 的 那个 SQL 的 
绑 定 变量 的 值 ， 而 无 法 使 优化 器 做 出 最 佳 选择 。 在 这 种 情况 下 ， 共 享 SQL 的 代价 就 太 大 了 。 因 
此 我 们 在 学 习 Oracle 时 一 定 要 话 学 活用 , 而 不 能 教条 主义 。 使 用 绑 定 变量 在 绝 大 多 数 情况 下 是 对 
的 ， 而 在 这 种 情况 下 ， 绝 对 不 能 使 用 绑 定 变量 

















Wr al a e e 


十 分 


once Myers cay SQL 


这 几 天 在 做 账 务 处 理 ， 需 要 将 一 批 数 据 生 成 到 临时 表 里 ， 然 后 再 进行 处 理 。 这 个 操作 以 往 就 
慢 。 XT HIVER RECEN 204755, 昨天 晚上 跑 了 6 个 小 时 还 没有 结果 ， 后 来 没 办 法 就 





中 断 了 。 负责 这 个 业务 的 小 叶 问 我 有 没有 什么 办 法 进行 优化 , 我 看 了 一 下 , 是 一 个 CTAS 的 语句 ， 
将 数据 生成 到 一 张 临时 表 里 : 


CREATE TABLE JFQR TEMP 
TABLESPACE TS SRHZ 
AS 
SELECT /*+ full(A) PARALLEL(A,4) */ A.YWID ZWYWID,C.YWID,A.SRXM,A.ZMID, 

















DECODE(A.WJBZ,'APS',H.ZMLX,D.ZMLX) ZMLX,DECODE(A.WJBZ,'APS','1',D.FYLB) FYLB, 
DECODE(D.PARTNER ID,1001,'1',1002,'2',1003,'3',2001,'4') ZHLX, 
DECODE(SUBSTR(A.ZMID JC,1,1),'R',to char(A.ZMID),A.ZMID JC) ZMID 9C, 

( 


DECODE (A.WJBZ, 'APS',H.SUM_TYPE, DECODE (NVL(E.SUM_TYPE,D.SUM_TYPE),'10', 'Kif', 
20' ，' 市 话 '，'40'，' 数 据 '，' 其 他 ' )) SUM TYPE, 
NVL(SUM(A.JFJE)/100,0) YSJE, 
NVL(SUM(A.JFJE)/100,0) ZSJE,C.YWHM,A.SBLX 
YWLX,DECODE(A.GHLX,'1','8','2','7','3','5', A.GHLX) 
GHLX,DECODE(A.KHLX,'1','1','2','3','3', '7' ,'4' ,'Z' , A.KHLX) 
FLSX,A.YHLX,A.XTBH,A.HMZT,A.YYSLX,A.WJBZ,DECODE(ZQ,0,'$(LoadTimeThis)',G.BILLING M 
ONTH) ZQ,qrxm,jflx 
FROM JFHZGW_YSSJ_ A, 
JFYWQYW C, 
JFZMQYW D, 
JFZMQYW E, 
JCZC.JFZQ G, 
JFFV APS ZW H 
WHERE A.YWID=C.ZWYWID(+) AND 
A.ZMID-D.ACCT ITEM TYPE ID(«) AND 
DECODE(SUBSTR(A.ZMID JC,1,1),'R',to char(A.ZMID),A.ZMID JC)-to char(E.ACCT ITEM. 
TYPE_ID(+)) AND 
A.ZQ-G.BILLING CYCLE ID(«) AND 
A.ZMID=H .JFLB (+) 
GROUP BY 
A.YWID,C.YWID,A.SRXM,A.ZMID,DECODE(A.WJBZ, 'APS',H.ZMLX,D.ZMLX) ,D.FYLB,D.PARTNER_ID, 
DECODE(SUBSTR(A.ZMID JC,1,1),'R',to char(A.ZMID),A.ZMID JC),DECODE(A.WJBZ, 'APS',H. 
SUM TYPE,DECODE(NVL(E.SUM TYPE,D.SUM TYPE),'10',' 长 话 ', '20', ' 市 话 ','40',' 数 据 ',' 其 他 '))， 
C.YWHM, A. SBLX, A. GHLX, A. KHLX, A. YHLX, A. XTBH, A. EMZT, A. YYSLX, A. WBZ, DECODE (ZQ, 0, 
'$(LoadTimeThis)',G.BILLING MONTH) ,qrxm,jflx; 


从 这 个 SQL 看 相当 复杂 ， 而 且 涉 及 多 张 很 大 的 表 。 这 个 SQL 如 果 不 拆 分 ， 纯 粹 想 通过 调整 
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执行 计划 来 进行 优化 将 十 分 困难 。 我 建议 她 将 SQL 拆 分 了 ， 用 一 个 存储 过 程 来 实现 。 先 扫描 那 
KRK, 然后 通过 访问 儿 张 维 表 进 行 数据 过 滤 和 表 连 接 ， 最 


插入 速度 ， 可 以 在 其 
确 的 指导 。 我 考虑 一 


create 

is 
TYPE 
TYPE 
TYPE 
TYPE 
TYPE 
TYPE 
TYPE 
VOWNE 


中 使 用 bulk 操作 。 
两 句 话 也 说 不 明白 ， 所 以 就 写 了 一 个 样板 程序 给 她 : 


小 叶 没 有 处 到 


or replace procedure testall 


TOWNER 
TSEGMENT NAME 
TSEGMENT TYPE 
TFILENAME 

TRFILENAME 

TEILE ID 
TRFILE ID 
R TOWNER; 








IS TABLE OF 


IS TABLE 
IS TABLE 
IS TABLE OF 
IS TABLE OF 
IS TABLE OF 
IS TABLE OF 








VSEGMENT NAME TSEGMENT NAME; 
VSEGMENT TYPE TSEGMENT TYPE; 


VFII 
VRFI 
VFI 
VRFI 
TYPE 
TYPE 
VFILE 
VFI 
CURSO 
CURSO 
str v 
FROM TA 
rowsl 
rows_ 
rows2 
i int 


L 








L 





j int 
k int 


type my cur type is ref cursor; 


LE. 


LE] 


ID TFI 
EI 


LE ID; 





ENAME T 
TFILELIST1 IS 
TFILELIST2 IS 
LIST1 TFILELI 
LIST2 TFILELI 
R CFILELIST1 
R CFILELIST2 
archar2(100) 
Tots 
integer; 




















D TRFILE ID; 
LENAME TFILENAME; 
RFILENAME; 


TABI 
TABI 
ST1; 
ST2; 
IS SEI 
IS SEI 








total integer; 


integer; 
eger; 
eger; 
eger; 


C3 my cur type; 


BEGIN 


DBMS OUTPUT.ENABLE (1000000); 


---- 装 载 维 表 数 据 


FOR 

V. 
END 
FOR 


END 


OPEN 


row: 
row: 


loop 


---- 批 量 提 
F 


FILEI 
LOOP; 
REC 
LE 
LOOP; 








s total:z0; 
S1:-rows, tota 








REC IN CFILEI 
LIST1 (REC. 


IN CFILEI 
LIST2(REC.relative fno) 


LIST1 LOOP 
FILE ID) 








LIST2 LOOP 


C3 FOR STR; 


l; 


: =REC . 


OF 
OF 


NUMBER 
NUMBER 


LE OF varchar2 (100) 
LE OF varchar2 (100) 


取 数 据 到 数组 ， 每 次 最 多 提取 1000 条 
ETCH c3 BULK COLLECT INTO VOWN. 





: =REC . 


ER,VS 








VARCHAR2 
VARCHAR2 
VARCHAR2 
VARCHAR2 
VARCHAR2 


RES 
过 类 似 的 案例 ， 


0) 
1) 
8) 
) 
) 


3 
8 
1. 
100 


( 
( 
( 
( 
(100 





INDEX 
INDEX 
INDEX 
INDEX 
INDEX 


因此 希望 


BY 
BY 
BY 
BY 
BY 


INDEX BY BINARY INTEGER; 
INDEX BY BINARY INTEGER; 


INDEX 


FILENAME; 


FILENAME; 





EGMENT NAM. 


BY 





E, VSI 


LECT FILE ID,FILENAME FROM TB1; 
LECT relative fno,FILENAME FROM TC1; 
:='SELECT OWNER,SEGMENT NAME,SEGMENT TYPE,FILE ID,RELATIV: 





EGM: 





ENT_TYPE 








我 给 


BINARY INT 
BINARY INT 
BINARY INT 
BINARY INT 
BINARY INT 


BINARY INTEGER; 
INDEX BY BINARY INTEGER; 





E 


结果 插入 到 临时 表 中 。 为 了 提高 
一 个 更 明 





= 





= 





E 








T 











, VFILE_ID, VRFILE_ 


__FNO 





ID 
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limit 1000; 
---- 提 取出 的 总 的 数据 量 (注意 是 总 数 ， 不 是 每 次 独立 提取 出 的 数据 量 ) 
rows total:-c3$bulk rowcount(1); 
----rows2 里 是 本 次 提取 的 总 数 ， 然 后 将 rows] 设置 为 当前 总 数 
rows2:-rows total-rows1; 
rowsl:-rows total; 
---- 如 果 本 次 提取 出 的 数据 量 为 0， 说明 记录 已 经 全 部 提取 完 ， 退 出 
exit when rows2-0; 
---- 通 过 维 表 的 数据 补充 相关 列 的 值 
for k in 1..rows2 loop 
vfilename(k):-vfilelisti(vfile id(k)); 
vRfilename(k):-vfilelist2(vrfile id(k)); 

















end loop; 
dbms output.put Line('begin to insert:'||to char(rows2)||' rows'); 
i:z1; 
j:-rows2; 
dbms output.put line('ij-('||to char(i)||','||to char(3)]||') 5: 





---- 使 用 FORALL INSERT， 批 量 插入 数据 
FORALL k in i..j 
INSERT into ta2 
values (VOWNER(k),VSEGMENT NAME(k),VSEGMENT TYPE(k),VFILENAME(K),VRFILENAME (K) ) ; 
commit; 
----Ank rows2 小 于 1000， 说 明 记录 已 经 全 部 提取 完 ， 退 出 
exit when rows2<1000; 
end loop; 
close C3; 
commit; 
END; 
/ 
根据 我 提供 的 脚本 , 小 叶 很 快 改 好 了 这 个 程序 。 测试 了 一 下 , 居然 不 到 1 个 小 时 就 跑 出 来 了 。 
找 出 几 个 数据 核对 了 一 下 ,也 完全 正确 。 这 个 往常 要 跑 两 三 个 小 时 ， 昨 天 晚上 跑 了 6 个 小 时 都 没 


跑 出 来 的 程序 ， 居 然 有 这 么 好 的 优化 效果 ， 大 家 都 很 高 兴 。 
m 2 优化 由 技 西 ) 拆 分 复杂 SQL 


拆 分 复杂 SQL 是 SQL 优化 中 经 常会 磁 到 的 一 个 工作 。 开 发 人 员 由 于 在 开发 过 程 中 往往 只 关 
注 于 SQL 功能 的 实现 ， 而 不 关心 其 性 能 ， 所 以 在 编写 SQL 时 经 常会 写 出 十 分 复杂 的 查询 。 一 旦 
EA SQL 写 得 十 分 复杂 ， 就 有 可 能 消耗 过 多 的 系统 资源 。 实 际 上 ， 开 发 人 员 是 对 业务 逻辑 最 为 
熟悉 的 人 员 ， 他 们 知道 一 个 业务 应 该 先 访问 哪 张 表 ， 取 出 什么 数据 ， 然 后 再 进行 什么 操作 ， 如 果 
他 们 能 够 把 这 个 流程 用 一 个 存储 过 程 写 出 来 ， 那 么 程序 将 会 十 分 清晰 ， 而 且 不 会 出 现 性 能 问题 。 
MEKE, 一旦 碰 到 类 似 的 问题 ， 程 序 员 往往 会 绞 尽 脑汁 ， 写 出 一 个 十 分 复杂 的 SQL 出 来 ， 就 
像 今 天 我 们 碰 到 的 那个 SQL 一 样 。 这 个 SQL 往往 会 消耗 大 量 的 系统 资源 , 而 且 一 旦 系统 上 线 后 ， 
就 没有 人 敢 去 修改 它 。 随 着 时 间 的 推移 ， 其 至 开发 这 个 SQL 的 人 都 很 难看 慌 其 中 的 业务 逻辑 关 
系 ， 今 后 再 去 优化 这 个 SQL 的 难度 就 越 来 越 大 了 。 

因此 作为 DBA， 总 是 希望 开发 人 员 不 要 写 过 于 复杂 的 SQL， 最 好 能 使 用 存储 过 程 来 处 理 业 
务 逻 辑 。 但 是 我 们 不 得 不 面 对 越 来 越 多 的 复杂 SQL, 在 这 种 情况 下 , 我 们 需要 了 解 拆 分 大 型 SQL 
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的 技术 。 

拆 分 大 型 SQL 首先 要 理解 SQL 的 含义 , 把 SQL 的 功能 分 解 为 多 个 单元 , 进而 划分 出 其 中 的 
中 间 数 据 集 。 如 果 通 过 对 这 些 中 间 数 据 集 的 分 析 ， 发 现 这 个 SQL 从 业务 逻辑 上 来 看 是 可 以 分 步 
执行 的 ， 那 么 这 个 SQL 就 是 可 以 拆 分 的 。 

拆 分 SQL 最 好 能 从 业务 的 角度 来 做 ， 因 此 最 好 能 够 得 到 开发 人 员 的 支持 。 如 果 得 不 到 开发 
人 员 的 支持 ， 必 须 首先 确保 对 SQL 功能 的 分 析 是 完全 正确 的 ， 否 则 可 能 会 吃力 不 讨好 。 
在 拆 分 SQL 时， 可 能 需要 使 用 一 些 复杂 的 技术 ， 比 如 Hash 连接 技术 。 有 时 候 ， 需 要 我 们 通 
过 类 似 Oracle 的 散 列 连接 的 算法 对 多 个 结果 集 进行 合并 。 如 果 拥 有 现成 的 类 库 ， 可 以 直接 调用 ， 
否则 对 于 一 般 程序 员 来 说 是 很 难处 理 的 。 如 果 碰 到 这 种 情况 ,可 以 首先 将 这 两 个 结果 集 写 人 临时 
表 ， 然 后 通过 SQL 对 这 两 张 临时 表 使 用 Hash 连接 进行 连接 。 











/\ 
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今天 是 周 日 ， 我 让 老 于 抓紧 时 间 回 趟 家 ， 我 来 值 一 下 班 。 由 于 这 几 天 一 直 在 做 账 务 处 理 ， 所 
以 周末 办 公 室 里 也 还 是 有 几 个 甲 方 的 人 在 做 处 理 。 由 于 不 是 工作 日 ， 所 以 也 没有 去 得 太 早 ， 早 上 
吃 完 早饭 后 上 了 会 网 ， 到 办 公 室 时 已 经 是 10 点 多 了 。 刚 到 办 公 室 就 接 到 一 个 电话 ， 他 们 在 把 一 
批 数 据 用 SQL * Loader 导入 到 数据 库 时 出 现 了 一 个 问题 .SQL*Loader 报错 LDR-704,ORA-12170 
连接 超时 出 现 ， 导 入 失败 。 导 入 的 数据 量 并 不 是 很 大 ， 也 就 是 100 多 万 条 记录 。 每 次 导入 进行 
一 段 时 间 后 就 会 报错 ， 每 次 报错 的 时 间 点 都 不 同 ， 并 没有 一 定 的 规律 性 。 

这 个 数据 装载 功能 是 新 业务 系统 引入 的 , 今天 是 第 一 次 和 运行。 我 让 他 们 马上 打开 客户 端的 跟 
EKo Mit Trace 文件 来 分 析 一 下 。 将 trace level client 设置 为 16 后， 又 进行 了 一 次 数据 载 


入 操作 。 打 开 Trace 文件 后 ， 看 到 如 下 信息 : 




















(5580) [7-11 月 -2008 14; 07:19:324] nttcnp: creating a socket. 

(5580) [7-11 H-2008 14; 07:19:324] nttcnp: exit 

(5580) [7-11 H-2008 14; 07:19:324] nttcni: entry 

(5580) [7-11 H-2008 14; 07:19:324] nttcni: trying to connect to socket 3804. 
(5580) [7-11 H-2008 14; 07:40:351] ntt2err: entry 

( 


5580) [7-11 月 -2008 14:07:40:351] ntt2err: soc 3804 error - operation-1, ntresnt[0]=505, 
ntresnt[1]260, ntresnt[2]=0 
(5580) [7-11 H-2008 14; :40:351] ntt2err: exit 
( ) [7-11 H-2008 14; :40:445] nttcni: exit 
(5580) [7-11 H-2008 14; 07:40:445] nttcon: exit 
( ) 4 
( 4 





4 
4 
4 
7-11 H-2008 14; :40:445] nserror: entry 
5580) [7-11 H-2008 14; 07:40:445] nserror: nsres: id-0, op=65, ns-12535, ns2=12560; 
n 
4 








t[2]=0; ora[0]=0, ora[1]=0, ora[2]=0 
: 07:40:445] nsopen: unable to open transport 


nt[0]=505, nt[1]=60, 
(5580) [7-11 月 -2008 1 


在 Trace 文件 里 可 以 明确 地 看 到 : trying to connect to socket 3804,soc 3804 error 
- operation =1,nttresnt[0]=505,ntresnt[1]=60,ntresnt[2]=0。 从 信息 上 看 ， 是 打开 套 
接 字 3804 时 出 的 问题 。 主 错误 信息 是 TNS-505， 也 就 是 操作 超时 ， 说 明 是 连接 3804 端口 时 出 现 
了 超时 。ntresnt [1]=60， 这 是 操作 系统 上 的 错误 信息 。 由 于 客户 端 是 Windows Server 2003, 
所 以 通过 下 面 的 命令 可 以 查看 操作 系统 的 错误 信息 : 

C:N>net helpmsg 60 

远程 适配器 不 兼容 。 

从 上 面 的 情况 看 ， 可 能 是 网 络 出 现 了 问题 。 从 后 面 的 信息 nserror: nsres: id-0, op=65, 
ns=12535, ns2=12560; nt[0]=505, nt[1]=60, nt[2]=0; ora[0]=0, ora[1]=0, ora[2]=0 
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可 以 看 出 ， 实 际 上 内 部 报 的 错误 号 是 TNS-12535。 这 个 错误 是 在 复杂 网 络 环境 下 ,特别 是 穿 透 防 
火 墙 时 经 常会 出 现 的 故障 。 因 此 , 我 猜测 是 由 于 通过 了 防火 墙 ， 导 致 了 套 接 字 重 定向 时 被 防火 墙 
挡住 了 ， 导 致 连接 3804 端口 失败 。 

由 于 今天 是 周末 ， 网 络 管理 员 没 有 上 班 ， 所 以 找 了 一 大 圈 才 找到 一 个 对 网 络 比较 了 解 的 人 。 
通过 那个 人 的 描述 ， 我 们 发 现在 那 台 Windows 2003 服务 器 到 计 费 服务 器 需要 经 过 2 道 防火 墙 。 
网 络 管理 人 员 也 说 不 清楚 到 底 防火 墙 的 策略 是 什么 , 不 过 可 以 确认 的 是 , 其 中 一 道 防火 墙 是 计 费 
网 络 和 业务 网 络 之 间 的 隔离 设备 ， 使 用 了 NAT。 

TNS-12535 在 NAT 环境 下 出 现 是 很 常见 的 ， 因 此 基本 可 以 定位 由 于 防火 墙 导致 了 这 个 问 
题 。 由 于 目前 没 办 法 在 短 时 间 内 解决 网 络 问 题 ， 所 以 我 建议 他 们 把 数据 复制 到 服务 器 上 ， 然 后 
再 导入 。 将 数据 FTP 过 来 以 后 再 执行 导入 ， 不 到 10 分 钟 就 全 部 导入 完毕 了 。 




















OD š 
今日 点 评 





通过 防火 墙 访问 数据 库 是 很 常见 的 问题 。 不 过 通过 防火 墙 访问 数据 库 经 常会 碰 到 不 稳定 的 现 
象 ， 就 是 经 常 出 现 一 些 莫 名 其 妙 的 ORA/TNS 错误 ， 连 接 会 突然 中 断 。 这 主要 是 由 于 防火 墙 的 包 
IEM NAT 功能 引起 的 。 处 理 这 样 的 情况 时 ， 一 般 可 以 采取 以 下 措施 : 

O 通过 VPN 穿 透 防火 墙 ， 如 果 网 络 稳定 ， 这 是 最 推荐 的 方式 ， 

O 使 用 CMAN 穿 透 防火 墙 ， 避 免 端口 重 定向 ; 

O 在 防火 墙 中 加 载 Oracle SQL*Net 模块 (部 分 防火 墙 支持 )。 

关于 这 方面 的 详细 信息 ， 可 以 参考 以 下 文档 。 

Note: 152988.1 How to Configure Oracle Net to Access a Server Behind a Firewall, 
Note: 152133.1 How To Do Oracle Net Connections Over a Firewall? 

Note: 45226.1 SOL *Net and Firewalls, 

Note: 2084440.6 Oracle and Firewalls: Answers to Frequently Asked Questions, 
Note: 125021.1 Oracle Connections and Firewalls, 

Note: 397393.1 External Clients behind NAT Translation / Port Forwarding / Tunneling Fail to 
Connect to Database (ORA-12535 or ORA-12541), 

Q Note: 558959.1 Oracle Connection Manager Configuration, 
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F Sme) 防火 墙 和 SQL*Net 


很 多 防火 墙 都 有 包 过 滤 和 NAT 功能 。 对 于 使 用 端口 重 定向 的 SQL*Net 协议 来 说 ， 可 能 会 碰 
到 很 多 问题 ， 导 致 SQL*Net 通过 防火 墙 访问 出 现 故障 。 为 了 解决 这 个 问题 ， 一 般 来 说 有 几 种 常 
用 方案 。 
O 使 用 VPN: 如 果 客户 端 能 够 通过 VPN 拨 入 内 网 ， 那 么 就 不 需要 使 用 NAT 了 ， 而 且 也 不 
会 受到 包 过 滤 的 限制 。 
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a 使 用 CMAN (Oracle Connect Manager), 
a 在 防火 墙 中 加 载 Oracle 专用 模块 (部 分 防火 墙 支持 )。 

通过 VPN 是 最 为 简单 的 解决 方案 ， 完 全 通过 网 络 技术 实现 ， 不 涉及 Oracle 的 配置 。 还 有 一 
种 方法 是 使 用 CMAN， 配 置 SQL*Net (tE, CMAN 代理 和 客户 端 之 间 是 固定 连接 ， 连接 后 不 会 
再 做 端口 重 定向 ， 这 样 就 不 会 出 现 类 似 于 今天 出 现 的 这 种 问题 。 

注意 , 关于 CMAN 安装 与 配置 , 请 参考 Metalink 文档 2077721.6 Installation and Configuration 
of Net8 Connection Manager (CMAN) (针对 Oracle 10g， 请 参考 298916.1 A Guide to 10g CMAN 


Configuration) , 


E fiel HIS) 跟踪 SQL*Net 


RESI SQL*Net 问题 ， 怎 么 办 呢 ? 大 多 数 情况 下 ，SQL*Net 问题 无 法 通过 Oracle 数据 库 的 日 
志 进 行 分 析 。 我 们 首先 根据 服务 器 端的 监听 状态 、 监 听 日 志和 服务 器 端的 sqlnet.log 来 进行 初步 
的 分 析 。 这 些 日 志 都 存放 在 SORACLE_HOME/network/log 目录 下 。sqlnet.ora 文 件 的 格式 如 下 : 


Fatal NI connect error 12638, connecting to: 
(DESCRIPTION= (LOCAL=YES) (ADDRESS= (PROTOCOL-beq))) 




















VERSION INFORMATION: 
TNS for 32-bit Windows: Version 9.2.0.8.0 - Production 
Oracle Bequeath NT Protocol Adapter for 32-bit Windows: Version 9.2.0.8.0 - 
Production 
Time: 15-12 月 -2008 08:05:23 
Tracing not turned on. 
Tns error struct: 
ns main err code: 12638 
TNS-12638: 身份 证 明 检索 失败 
ns secondary err code: 0 
nt main err code: 0 
nt secondary err code: 0 
nt OS err code: O0 


在 这 个 Trace 信息 里 ， 找 到 TNS 的 错误 信息 ， 根 据 TNS-xxxx 就 可 以 进行 分 析 了 。 如 果 在 服 
务 器 端的 Trace 里 找 不 到 有 价值 的 信息 ， 或 者 无 法 明确 定位 故障 点 ， 那 么 就 需要 通过 客户 端的 
Trace 来 进行 分 析 。 设 置 客户 端 Trace 的 方法 如 下 : 

修改 客户 端的 SORACLE HOME/network/admin/sglnet.ora 





trace level client = < 级 别 > 
trace file client - client 
trace directory client = < 路 径 > 


在 今天 分 析 SQL*Net 故障 时 , 我 设置 了 trace level client =16。 在 使 用 16 级 Trace bF, 
会 生成 十 分 详细 的 跟踪 信息 。 比 如 ， 我 们 生成 的 Trace 文件 为 : 


(7288) [10-11 月 -2008 20:54:56:552] nsopen: opening transport... 
(7288) [10-11 月 -2008 20:54:56:552] nttcon: entry 
(7288) [10-11 H-2008 20:54:56:552] nttcon: toc = 1 
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(7288) [10-11 H-2008 20:54:56:552] nttcnp: entry 

(7288) [10-11 H-2008 20:54:56:552] nttcnp: creating a socket. 

(7288) [10-11 H-2008 20:54:56:552] nttcnp: exit 

(7288) [10-11 H-2008 20:54:56:552] nttcni: entry 

(7288) [10-11 H-2008 20:54:56:552] nttcni: trying to connect to socket 3804. 
(7288) [10-11 H-2008 20:54:56:552] snlinGetNameInfo: entry 

(7288) [10-11 H-2008 20:54:56:552] snlinGetNameInfo: Using numeric form of host's 
address 10.2.0.39 

(7288) [10-11 H-2008 20:54:56:552] snlinGetNameInfo: exit 

(7288) [10-11 H-2008 20:54:56:552] nttcni: connected on ipaddr 10.2.0.39 
(7288) [10-11 H-2008 20:54:56:552] nttcni: exit 

(7288) [10-11 H-2008 20:54:56:552] nttcon: NT layer TCP/IP connection has been 
established. 

(7288) [10-11 H-2008 20:54:56:552] nttcon: set TCP NODELAY on 3804 

(7288) [10-11 H-2008 20:54:56:552] nttcon: exit 








上 面 是 一 次 成 功 的 连接 ， 最 终 成 功 地 打开 了 套 接 字 3804， 并 且 进 行 了 正常 的 通信 。 与 今天 
日 记 里 那个 失败 的 结果 相 比 较 ， 就 很 容易 搞 清楚 我 们 该 如 何 分 析 这 个 Trace 文件 了 。 


4 
V e—e—e w 
SESE 全 休息 时 总 是 最 忙 的 


由 于 明天 要 进行 实施 ， 所 以 今天 安排 轮流 休息 ,我 被 安排 在 上 午休 息 。 上 午 吃 过 早饭 后 回 到 
房间 躺 了 一 会 儿 ， 不 过 总 是 睡 不 着 ， 我 没有 白天 睡觉 的 习惯 。 躺 了 半天 ， 精 神 头 越 来 越 好 ， 实 在 
无 聊 只 好 起 来 上 网 。 刚 刚 在 QQ 上 和 和 群 里 的 哥们 聊 了 几 名 ， 一 个 客户 通过 MSN 找到 我 了 。 他 说 
有 个 很 奇怪 的 操作 ， 系 统 其 他 的 都 很 正常 ， 就 是 有 一 个 存储 过 程 ， 只 要 一 编译 就 挂 住 。 我 问 他 是 
不 是 比较 慢 ， 他 说 不 是 慢 就 像 挂 死 了 一 样 ， 根 本 没有 反应 。 

磁 到 这 种 情况 ， 一 般 来 说 首先 应 该 做 一 个 hanganalyze。 于 是 我 建议 他 马上 用 系统 账号 登录 ， 
然后 做 一 个 hanganalyze ; 


SQL>oradebug setmypid; 
SQL>oradebug hanganalyze 3; 


很 快 他 就 把 Trace 文件 发 给 我 了 。 打 开 Trace 文件 ， 可 以 很 明显 看 到 阻塞 的 情况 ， 








Open chains found: 

Chain 1 : «sid/sess srno/proc ptr/ospid/wait event» : 
«48/29750/0x3ed60060/7856/PX Deq: Join ACK> 

-- <141/31823/0x3ed5d680/2291/library cache pin» 

Chain 2 : «sid/sess srno/proc ptr/ospid/wait event» : 
<76/16377/0x3ed554b0/6507/No Wait» 

Chain 3 : «sid/sess srno/proc ptr/ospid/wait event» : 
«98/8617/0x3ed65c80/4550/No Wait» 

Chain 4 : «sid/sess srno/proc ptr/ospid/wait event» : 
«117/43613/0x3ed55080/6505/No Wait» 


其 中 sid 为 141 的 会 话 就 是 那个 被 挂 起 的 会 话 。 从 hanganalyze 报告 上 看 , 这 个 会 话 被 sid 为 48 的 会 
话 阻塞 了 。48 号 会 话 正在 等 待 PX:DeqACK。 从 v$session rh, REH 48 号 会 话 的 状态 是 killed, 
看 样子 这 个 会 话 已 经 被 杀 掉 了 。 在 vssession 中 继续 检查 ， 发 现 这 个 会 话 的 程序 是 Oracle(ayzstat 
(P001)。 从 现象 上 看 ， 这 是 由 于 并 行 查询 被 终止 后 ，slaver 被 杀 掉 ， 会 话 已 经 被 标志 为 killed， 不 过 
进程 并 没有 退出 ， 资 源 也 就 没有 释放 ， 而 这 个 会 话 正 好 PIN 住 了 141 会 话 编译 存储 过 程 所 需要 的 。 
确认 了 这 个 进程 可 以 杀 掉 后 ， 使 用 kill-9 7856 杀 死 该 进程 ， 被 阻塞 的 操作 马上 完成 了 。 

处 理 完了 以 后 ， 又 和 客户 讲 了 半天 hanganalyze 的 使 用 方法 以 及 注意 事项 。 处 理 完 这 个 案例 
后 ， 看 看 时 间 已 经 是 11 点 多 了 ， 该 去 和 老 于 约 好 的 餐厅 了 。 我 到 的 时 候 ， 老 于 他 们 几 个 都 到 了 。 
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下 午 我 和 老 能 值班 , 老 于 和 老 肖 回去 休息 。 大 家 一 起 讨论 了 明天 的 主要 事情 ， 都 对 明天 的 调整 表 
示 出 了 很 强 的 信心 , 最 好 是 能 够 毕 其 功 于 一 役 , 这 样 我 们 今后 的 工作 也 比较 好 开展 。 如 果 系 统 级 
的 调整 达到 了 目标 ， 下 一 阶段 重点 和 集成 商 一 起 进行 SQL 优化 就 可 以 了 。 

下 午 过 得 较为 平淡 ， 系 统 负 载 很 高 ， 特 别 是 IO 的 压力 很 大 ， 不 过 总 的 来 说 还 算 平稳 。 这 几 
天 营业 系统 负载 较 轻 ， 主 要 的 系统 压力 来 自 于 账 务 处 理 。 我 和 老 能 也 在 抓紧 时 间 整 理 文档 。 主 要 
的 SQL 都 已 经 整理 出 来 了 ， 并 且 绝 大 部 分 SQL 的 优化 方案 也 已 经 细 化 ， 就 等 开发 商 去 修改 程序 
了 。 今 天 我 们 两 个 人 对 每 个 SQL 的 状态 按照 最 新 的 反馈 情况 进行 了 更 新 ， 更 新 后 重新 统计 了 一 
下 ， 发 现 完成 状态 的 SQL 只 有 20% 多 一 点 ， 而 且 除 了 一 个 UNION 改 为 UNION ALL 的 语句 和 几 
个 我 们 协助 甲 方 修改 的 存储 过 程 外 , 其 他 完成 优化 的 语句 基本 上 都 是 通过 调整 索引 来 优化 的 。 也 
就 是 说 , 开发 商 调 整 程序 的 进度 十 分 缓慢 , 我 和 老 能 都 感觉 到 ,开发 商 修改 程序 的 进度 可 能 会 跟 
不 上 整个 优化 的 进度 。 

碰 到 这 种 情况 , 我 们 唯一 能 做 的 就 是 把 优化 方案 搞 得 更 为 细致 , 使 开发 商 找 不 出 不 修改 程序 
的 理由 。 因此 我 和 老 熊 分 了 分 工 , 每 个 人 负责 儿 个 复杂 SQL 的 分 析 , 争取 在 这 几 天 里 把 所 有 SQL 
的 优化 方案 都 写 得 比较 明确 ,以 便 提交 给 开发 商 后 ,他们 可 以 直接 修改 程序 ,而 不 需要 再 去 做 分 
析 了 。 

不 知 不 觉 已 经 快 6 : 00 了。 一 般 来 说 , 5 : 30 就 下 班 了 , 不 过 5 : 30 之 后 的 15 分 钟 里 可 能 会 
出 现 一 个 小 的 业务 高 峰 , 因为 所 有 的 营业 员 下 班 前 都 要 做 日 常 扎 账 的 功能 。 我 临 走 前 看 了 看 OEM 
的 监控 屏幕 ， 除 了 VO 高 一 点 ，CPU 的 负载 已 经 从 刚才 高 峰 期 间 的 100% 下 降 到 70% 左 右 ， 看 样 
子 还 算 稳 定 。 现 在 已 经 快 6 : 00 了, 各 个 营业 厅 应 该 已 经 下 班 了 ， 优 化 前 的 倒数 第 二 个 营业 日 应 
该 是 平稳 过 去 了 。 收 拾 好 电脑 ， 我 和 老 能 正 准备 离开 。 同 样 准备 离开 的 小 孙 突 然 叫 了 起 来 :“ 白 
哥 ， 你 快 看 看 ， 数 据 库 是 不 是 宕 了 ? ” 

我 马上 登 上 系统 ， 发 现 数据 库 确 实 是 宕 了 。 从 日 志 上 看 到 下 面 的 信息 : 


Sun May 5 18:02:34 2006 

Errors in file /datal/Oracle9/app/admin/sdh/bdump/sdh dbw3, 462948.trc: 
ORA-27061: skgfospo: waiting for async I/Os failed 

IBM AIX RISC System/6000 Error: 22: Invalid argument 

Sun May 5 18:02:34 2006 

DBW3: terminating instance due to error 27061 

Instance terminated by DBW3, pid = 462948 


第 一 眼看 到 这 个 信息 ， 就 知道 这 是 异步 VO 的 问题 。 在 AIX 上 ， 由 于 异步 VO 引起 的 宕 机 也 
不 是 什么 新 鲜 事 了 。 由 于 操作 系统 和 数据 库 的 bug 问题 ， 如 果 数 据 库 使 用 了 文件 系统 ， 在 AIX 
上 很 容易 出 现 由 于 异步 IO 参数 设置 不 足 而 导致 的 系统 宕 机 。 因 此 , 我 第 一 时 间 检 查 了 aio 的 设 
置 : 


# lsattr -El aio0 

autoconfig available STATE to be configured at system restart True 
fastpath enable State of fast path True 
kprocprio 39 Server PRIORITY True 
maxreqs 4096 Maximum number of REQUESTS True 
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maxservers 40 MAXIMUM number of servers per cpu True 
minservers 10 MINIMUM number of servers True 


果然 所 有 的 异步 IO 参数 都 使 用 的 是 默认 值 。 临 时 的 解决 方案 是 加 大 异步 VO 相关 参数 ， 不 
过 这 也 只 能 作为 权宜 之 计 。 加 大 异步 VO 参数 只 能 减少 宕 机 的 机 会 ， 并 不 能 彻底 解决 这 个 问题 ， 
必须 做 操作 系统 升级 并 且 打 数据 库 的 补丁 才能 解决 这 个 问题 。 不 过 如 果 明 天 晚上 优化 时 加 上 这 两 
个 操作 ， 整 个 优化 计划 都 要 推倒 重 做 。 从 目前 的 情况 来 看 ， 条 件 是 不 允许 的 。 我 和 老 于 通 了 电话 
沟通 了 这 件 事情 ， 大 家 的 一 致 看 法 是 ， 先 通过 调整 参数 顶 一 下 ， 等 系统 稳定 后 再 找 时 间 升 级 。 
为 明天 的 优化 会 较 大 幅度 地 减少 物理 VO, 另外 通过 加 大 异步 IO 相关 的 参数 也 可 以 加 大 异步 IO 
的 处 理 能 力 ， 经 过 调整 后 ， 由 异步 VO 产生 的 宕 机 现象 将 会 得 到 控制 。 等 优化 完成 后 ， 下 一 个 账 
期 前 再 进行 操作 系统 的 升级 和 数据 库 补 丁 的 安装 。 

和 老 于 讨论 完 后 ,我 给 张 工 打 了 个 电话 ， 把 今天 宕 机 的 原因 告诉 了 他 , 并且 把 我 们 的 想法 也 
和 他 做 了 沟通 ， 张 工 比较 赞同 我 们 的 想法 。 

回 到 酒店 ， 我 和 老 于 一 起 调整 了 优化 方案 ， 增 加 了 对 异步 VO 参数 调整 的 内 容 : 
口 将 Maxreas 修改 为 8192 ; 
口 将 Maxservers 修改 为 256; 
O 将 Minservers 修改 为 50。 


X spam 


















































今天 老 白 磁 到 了 系统 挂 住 的 情况 ， 然 后 又 磁 到 了 一 次 由 于 异步 VO 而 引起 的 宕 机 。 由 于 异步 
VO 引起 宕 机 是 DBA 经 常 碰 到 的 , 一 般 的 错误 号 都 是 ORA-27XXX。 在 AIX F, Sic I/O 的 
问题 在 Oracle 8i, Oracle 9i 和 Oracle 10g 中 都 有 发 生 。 一 般 在 使 用 文件 系统 的 环境 下 ， 使 用 裸 设 
备 就 很 少 出 现 。 因为 在 AIX 下 裸 设备 的 异步 VO 是 核心 支持 的 , 而 文件 系统 必须 使 用 AIO Server, 
磁 到 老 白 今 天 下 午 遇 到 的 问题 ， 一 般 来 说 需要 将 AIX 升级 到 5.3 TL6 或 者 更 高 的 版 本 ， 并 且 打 
Oracle 9i 的 补丁 。 详 情 可 以 参考 以 下 文档 。 
Q Note:390656.1 I/O Interoperability Issue between IBM MLO05 and Oracle Databases, 
Q Note:452866.1 Database crashes producing ORA-27061 , 
O Note:467282.1 Instance down due to ORA-27061: skgfospo: waiting for async I/Os failed, 
Qa 4401119.8 Bug 4401119 - AIX: Crash possible on AIX (ORA-206), 

其 实 异步 IO 的 问题 在 其 他 操作 系统 下 也 常 有 发 生 。 由 于 今天 没有 碰 到 , 老 白 也 就 偷 点 懒 了 。 
大 家 可 以 去 Metalink 上 查找 相关 的 文档 。 


e 人 优化 小 技巧 ) 使 用 hanganalyze 


数据 库 挂 住 是 件 比较 头痛 的 事情 。 如 何 找到 挂 住 的 原因 是 DBA 必须 面临 的 课题 。 当 数据 库 
HEER, 大 多 数 DBA 往往 是 通过 v$session wait 视图 来 进行 分 析 。 实 际 上 ，Oracle 有 一 个 十 
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分 有 效 的 工具 一 一 hanganalyze。hanganalyze 可 以 十 分 清晰 地 将 挂 住 的 信息 告诉 DBA, 便于 DBA 
进行 进一步 分 析 。hanganalyze 是 从 Oracle 8ir2(8.1.6) 开 始 提 供 的 ， 其 用 法 十 分 简单 : 

ALTER SESSION SET EVENTS 'immediate trace name HANGANALYZE level <level>'; 
或 者 

ORADEBUG hanganalyze «level» 


比如 : 


sql>oradebug setmypid; 
sql>oradebug hanganalyze 3; 


对 于 <level> 的 定义 ， 取 值 以 及 对 应 的 说 明 如 下 。 

a 10, MAHE (IGN state), 

a 5, Level 4+ 等 待 链 中 的 所 有 进程 (NLEAF state) , 

O 4, Level3 + 等 待 链 中 阻塞 进程 的 状态 (LEAF, LEAF NW, IGN DMP state), 
a 3, Level2 + 被 挂 住 的 进程 的 状态 (IN HANG state), 

o 1 和 2。 只 输出 hanganalyze， 不 输出 进程 信息 。 

下 面 是 一 个 3 级 的 hanganalyze (一 般 情 况 下 ， 使 用 3 级 就 可 以 了 ): 


/oracle/app/oracle/admin/bill/udump/ora_4550_bill.trcOracle8i 
Enterprise Edition Release 8.1.7.4.0 - 64bit Production 
With the Partitioning option 

JServer Release 8.1.7.4.0 - 64bit Production 
ORACLE_HOME = /oracle/app/oracle/product/8.1.7 

System name: HP-UX 

Node name: yzstat 

Release: B.11.11 

Version: U 

Machine: 9000/800 

Instance name: bill 

Redo thread mounted by this instance: 2 

Oracle process number: 75 

Unix process pid: 4550, image: oracle@yzstat (TNS V1-V3) 
*** SESSION ID: (98.8617) 2008-02-23 17:45:07.011*** 
2008-02-23 17:45:07.010 














Open chains found: 

Chain 1 
<sid/sess_srno/proc_ptr/ospid/wait_event> 
<48/29750/0x3ed60060/7856/PX Deq: Join ACK> 
-- <141/31823/0x3ed5d680/2291/library cache pin> 
Chain 2 
<sid/sess_srno/proc_ptr/ospid/wait_event> 
<76/16377/0x3ed554b0/6507/No Wait» 

Chain 3 
<sid/sess_srno/proc_ptr/ospid/wait_event> 
«98/8617/0x3ed65c80/4550/No Wait» 

Chain 4 

«gid/sess srno/proc ptr/ospid/wait event» 
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<117/43613/0x3ed55080/6505/No Wait» 
Other chains found: 
Extra information that will be dumped at higher levels: 





level 4] : 4 node dumps -- [LEAF] [LEAF NW] [IGN DMP] 
level 5] : 1 node dumps -- [NLEAF] 
level 10] : 78 node dumps -- [IGN] 


State of nodes ( [nodenum] /sid/sess srno/session/state/start/finish/[adjlist]/predecessor): 
0]/1/1/0x3ee65290/1GN/1/2//none 
/2/1/0x3ee65c10/IGN/3/4//none 
/3/1/0x3ee66590/IGN/5/6//none 
/4/1/0x3ee66£10/IGN/7/8//none 
/5/1/0x3ee67890/IGN/9/10//none 
/6/1/0x3ee68210/1GN/11/12//none 
/7/1/0x3ee68b90/IGN/13/14//none 
/9/28264/0x3ee69e90/IGN/15/16//none 
/10/45631/0x3ee6a810/IGN/17/18//none 
0] /11/53468/0x3ee6b190/IGN/19/20//none 
1]/12/1/0x3ee6bb10/IGN/21/22//none 











F F O OO O U 8 Q N P. 


*** WARNING: no system state dumped *** 


我 们 可 以 看 到 , 在 Open chains 里 加 粗 部 分 就 是 可 能 挂 住 的 环 。 对 于 确定 的 内 部 死 锁 ，Oracle 
会 在 Cycles 里 列 出 ， 比 如 : 


Cycle 1 : «sid/sess srno/proc ptr/ospid/wait event» : 
«980/3887/0xe4214964/24065/1atch free» 

-- «2518/352/0xe4216560/24574/1latch free» 

-- <55/10/0xe41236a8/13751/latch free» 


我 们 可 以 看 出 ，980 号 会 话 在 等 待 latch free, BIE f 2518 号 会 话 和 55 号 会 话 ， 这 两 个 会 
话 也 在 等 待 latch free。 这 个 时 候 杀 掉 980 号 会 话 就 可 以 解 开 这 个 环 。 直 接 在 hanganalye 里 就 可 以 
看 到 980 号 会 话 的 ospid 是 24065， 直 接 在 操作 系统 下 使 用 kill-9 24065 就 可 以 了 。 

根据 hanganalyze 的 结果 ， 我 们 再 去 分 析 原 因 就 容易 多 了 。 很 多 DBA 喜欢 通过 脚本 去 分 析 
v$1lock 和 vSsession_wait。 实 际 上 , 通过 hanganalyze 可 以 更 为 快捷 地 分 析出 系统 挂 住 的 原因 。 
在 做 hanganalyze 时 ， 对 于 Cycle， 直 接 杀 掉 某 个 会 话 就 可 以 解决 问题 。 如 果 是 Open chains, JB 
么 就 不 一 定 是 挂 住 了 。 系 统 如 果 比 较 慢 ， 也 会 出 现 Open chains。 为 了 明确 是 由 于 系统 比较 慢 导 
致 的 还 是 由 于 某 个 会 话 阻止 了 其 他 会 话 ， 可 以 做 一 个 hanganalyze， 然 后 再 等 待 3~5 分 钟 做 第 二 
个 hanganalyze， 两 个 比较 一 下 就 可 以 看 得 很 清楚 了 。 如 果 在 两 个 hanganalyze H, chain 的 状态 没 
有 任何 改变 ， 那 么 说 明 是 挂 住 了 ， 否 则 可 能 是 由 于 慢 导 致 的 问题 。 

在 最 后 ， 老 白 再 给 大 家 介绍 一 个 小 技巧 ， 如 果 数 据 库 挂 住 了 ， 连 登录 都 无 法 做 了 ， 我 们 该 怎 
么 处 理 呢 ? 如 果 你 比较 幸运 ， 使 用 的 是 Oracle 10g， 就 可 以 通过 下 面 的 办 法 进行 处 理 : 


sqlplus -prelim /nolog 
SQL>connect / as sysdba 
SQL>oradebug setmypid; 
SQL>oradebug hanganalyze 3 


使 用 -prelim 参 数 强行 登录 数据 库 ,不 过 这 个 登录 的 会 话 只 能 做 系统 状态 转 储 和 hanganalyze 
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之 类 的 诊断 工作 ,不 能 做 其 他 事情 。 不 过 这 也 为 我 们 分 析 挂 住 的 原因 提供 了 很 好 的 支持 。 记 住 这 
个 小 技巧 是 十 分 有 用 的 。 


PSREN) 重 做 日 志文 件 优化 的 要 点 


重 做 日 志 对 IO 的 影响 十 分 大 , 特别 是 繁忙 的 系统 。 一 般 来 说 , 我 们 都 会 建议 数据 库 安装 时 ， 
重 做 日 志 使 用 独立 的 盘 组 存放 ， 而 不 要 和 其 他 文件 混合 存放 。 而 在 实际 情况 下 ,我 们 很 少 能 够 看 
到 这 样 的 用 户 。 在 早期 的 系统 中 ,存储 的 容量 有 限 ， 硬 盘 价格 也 比较 贵 ， 因 此 这 些 系统 都 没有 采 
用 重 做 日 志文 件 独立 存放 。 这样 做 最 初 的 目的 是 为 了 节约 宝贵 的 存储 空间 ， 而 在 磁盘 价格 十 分 低 
的 今天 ， 这 种 坏 习 惯 被 延续 了 下 来 。 实 际 上 ， 在 硬盘 价格 相对 便宜 的 今天 ， 在 系统 规划 之 初 ， 将 
重 做 日 志文 件 存放 在 独立 的 系统 上 不 是 一 件 难事 。 另 外 , Ei A BX LE ERE AE 
小 IO， 因 此 重 做 日 志文 件 最 好 存放 在 RAID 1 的 存储 设备 上 ， 而 尽量 不 要 存放 在 RAID5 上。 由 
于 重 做 日 志文 件 是 顺序 写 的 , 所 以 多 个 重 做 日 志文 件 放 在 同一 个 磁盘 上 不 会 引起 性 能 问题 。 不 过 
同一 个 日 志 组 的 多 个 成 员 最 好 不 要 存放 在 相同 的 磁盘 上 ， 以 避免 IO 冲突 。 老 白 做 过 一 个 项 目 ， 
把 重 做 日 志文 件 和 数据 文件 分 离 后 ， 数 据 文件 所 在 盘 组 的 VO 负载 下 降 了 20% 多 。 

不 过 如 果 你 使 用 了 重 做 日 志 镜 像 , 也 就 是 说 一 个 重 做 日 志 组 有 多 个 成 员 , 那么 相同 的 成 员 最 
好 不 要 存放 在 相同 的 磁盘 上 。 在 10 年 前 , 我 经 常 使 用 一 种 存储 方式 ,就 是 在 系统 中 找 两 块 裸 盘 ， 
这 两 块 盘 在 盘 阵 中 做 成 JBOD， 把 重 做 日 志 的 两 个 镜像 分 别 存放 在 这 两 块 裸 盘 上 。 也 就 是 说 ， 重 
做 日 志文 件 存放 在 无 RAID 保护 的 独立 盘 上 , 依靠 镜像 来 实现 高 可 靠 性 。 在 IO 性 能 较 差 的 年 代 ， 
这 种 做 法 对 于 提高 整体 VO 性 能 帮助 很 大 。 目 前 IO 系统 的 能 力 越 来 越 强 ， 这 种 极端 需求 也 很 少 
出 现 了 。 并 且 现 在 绝 大 多 数 存 储 都 不 支持 裸 盘 , 所 以 这 种 配置 现在 基本 上 看 不 见 了 。 不 过 对 于 VO 
特别 敏感 的 系统 ， 为 了 提高 安全 性 ， 必 须 设置 重 做 日 志 镜 像 ， 那 么 也 可 以 拿 出 两 组 独立 的 盘 组 ， 
专门 用 于 存放 重 做 日 志 ， 这 对 于 提升 总 体 IO 性 能 的 帮助 很 大 ， 虽 然 这 么 做 很 浪费 。 

最 后 一 点 要 说 明 的 是 ,独立 重 做 日 志 的 存储 一 定 要 在 数据 库 创 建 时 就 做 , 不 要 等 到 系统 出 现 
VO 问题 时 再 去 做 。 因 为 这 时 , DBA 可 能 会 发 现 , 盘 阵 中 已 经 没有 空闲 的 盘 组 给 重 做 日 志 使 用 了 。 
这 也 是 最 常见 的 现象 。 

重 做 日 志 的 大 小 也 会 对 系统 性 能 有 比较 大 的 影响 ， 包 括 对 IO 系统 。 如 果 重 做 日 志 太 小 , 会 
导致 日 志 切 换 十 分 频繁 ， 从 而 影响 系统 性 能 。 一 般 来 说 ， 保 证 重 做 日 志 切 换 周期 不 低 于 15 分 钟 
是 十 分 必要 的 。 
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! A ~ AN 


6 月 6 日 用 实施 优化 


今天 晚上 要 做 优化 的 实施 ， 所 以 都 睡 了 个 懒 觉 。 我 没有 睡懒觉 的 习惯 ,9 : 00 不 到 就 再 也 没 
法 在 床上 趟 着 了 ， 到 楼 下 吃 了 早餐 。 吃 完 早 餐 后 本 来 想 出 去 走 走 ， 后 来 想 了 半天 也 没 想 好 去 哪 ， 
只 好 回 到 房间 来 上 网 。 方 案 已 经 制订 得 十 分 完备 了 , 实际 操作 主要 由 老 肖 来 做 , 我 只 是 负责 协调 ， 
因此 今天 我 的 压力 并 不 大 。 经 过 一 个 星期 的 突击 ， 体 力也 确实 有 点 透支 了 ,今天 晚上 可 能 会 遇 到 
很 多 问题 ， 也 许 并 不 会 很 顺利 ， 因 此 我 必须 有 足够 的 体力 来 保证 晚上 大 脑 不 出 现 真 空 。10 点 多 
钟 ， 大 家 纷纷 起 床 了， 然后 一 起 在 老 于 的 房间 里 磁 了 一 下 ， 就 去 现场 了 。 

客户 对 今天 晚上 的 实施 十 分 重视 , 张 工 他 们 三 个 都 一 起 到 现场 来 值守 。 预 定 的 停机 时 间 是 晚 
上 8 : 00。 为 了 保证 实施 的 顺利 进行 ， 提 前 一 天 申请 了 停止 所 有 夜间 Job 和 数据 库 备 份 作业 。 

从 下 午 5 : 00 开始， 通过 OEM 的 实时 监控 看 到 系统 负载 很 小 ， 因 此 我 和 老 于 决定 对 于 主要 
业务 表 的 分 析 操 作 提 前 开始 。 从 5 : 00 开始 ,我 们 首先 挑选 了 部 分 比较 小 的 表 进 行 分 析 ， 这 些小 
表 很 快 都 分 析 完 了 。 于 是 老 首开 始 分 析 第 二 批 略 大 的 表 ， 这 批 表 大 概 花 了 半 个 小 时 分 析 完 毕 。 剩 
下 的 都 是 100 万 条 记录 以 上 的 大 表 了 ， 大 概 有 30 多 张 ， 我 们 怕 表 分 析 会 引起 执行 计划 改变 ， 所 
以 决定 在 6 : 00 开始 做 。 到 6 : OOK, 老 肖 通过 4 个 窗口 ,开始 分 批 分 析 这 些 表 ， 到 晚上 7 : 30, 
除了 半夜 要 做 分 区 的 儿 张 大 表 ， 所 有 的 分 析 操 作 全 部 完成 。 这 部 分 工作 顺利 完成 ,大 大 减轻 了 半 
夜 时 的 操作 压力 。 

晚上 7 : 30， 我 们 几 个 和 张 工 他 们 一 起 开 了 个 短 会 ， 开 发 商 的 小 孙 也 参加 了 这 个 准备 会 。 准 
备 会 的 内 容 很 简单 ， 就 是 明确 各 自 的 工作 任务 以 及 接口 ,并且 明确 如 果 优 化 失败 ， 最 后 回 退 的 时 
间 定 在 凌晨 4 : 00。 如 果 本 次 优化 存在 问题 ， 在 4 : 00 之 前 一 定 要 停止 ， 并 且 进行 回 退 操作 。 

晚上 7 : 50， 和 老 肖 最 后 一 次 确认 了 所 有 的 实施 脚本 。 老 肖 开 始 进行 停机 前 的 操作 ， 开 始 备 
份 参数 文件 。 优 化 的 预案 做 得 十 分 完整 ,每 项 工作 都 写成 了 脚本 , 并 且 针 对 每 项 工作 都 准备 了 应 
急 预 案 。 每 个 时 间 点 完成 什么 工作 ， 都 在 一 张 检 查 表 上 写 得 清 清 楚楚 。 检 查 表 都 打印 了 出 来 ,我 
们 几 个 人 手 一 份 ,每 完成 一 个 工作 ,每 个 人 都 必须 在 检查 表 上 打 钩 签字 。 最 后 这 份 检 查 表 将 由 客 
户 存档 。 为 了 保险 起 见 ， 我 们 规定 所 有 的 脚本 都 不 允许 直接 和 运行， 而 是 通过 命令 复制 粘贴 的 方式 
运行 ; 在 每 条 命令 提交 前 ， 都 需要 有 人 人 负责 复核 。 今 天 的 操作 员 是 老 肖 ， 老 于 负责 复核 ,我 作为 
后 备 ， 主 要 协调 小 孙 测 试 应 用 。 

8 : 00 时 ， 张 工 和 监控 室 确定 停机 时 间 后 ， 对 大 家 说 :“ 可 以 开始 了 ， 哥 几 个 ,拜托 了 1!” 

8 : 00 时 ， 小 孙 开 始 了 第 一 项 工作 ， 关 闭 应 用 系统 。 这 项 工作 十 分 复杂 ，20 分 钟 后 ， 一 部 分 
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Tuxedo 的 会 话 还 是 没有 正常 关闭 。 小 孙 确 认 这 是 正常 现象 ， 每 次 关闭 应 用 时 都 会 有 部 分 Tuxedo 
会 话 无 法 正常 退出 。 我 们 为 关闭 应 用 预 留 的 时 间 是 30 分 钟 。 为 了 确保 进度 不 受 影响 ， 大 家 决 
定 直 接 杀 进程 ， 小 孙 手 头 有 现成 的 脚本 ， 执 行 后 ， 所 有 的 会 话 全 部 退出 。 

在 小 孙 停 应 用 的 同时 ， 老 肖 已 经 修改 完了 参数 文件 。 修 改 参数 文件 采用 的 是 通过 SPFILE Æ 
成 PFILE， 然 后 直接 修改 PFILE 的 方式 。 修 改 完毕 后 ， 直 接 通 过 PFILE 生成 SPFILE, 

8 : 30， 应 用 系统 正常 关闭 ， 数 据 库 很 快 也 关闭 了 。8 : 35， 监 听 进 程 也 停止 了 。 下 一 步 是 调 
整 操 作 系统 参数 。 操 作 系 统 参数 修改 早已 写成 了 shell 脚本 ， 老 肖 直 接 将 shell 脚本 中 的 命令 复制 
出 来 ， 在 shell 下 执行 。 脚 本 执行 完毕 后 ， 老 于 通过 另外 一 台 终 端 ， 使 用 预先 准备 好 的 校 验 脚 本 
检查 了 操作 系统 参数 修改 的 结果 ， 确 认 无 误 后 ， 大 家 在 检查 表 上 签字 确认 。 

8:50, Oracle 参数 修改 完毕 ， 数 据 库 顺利 重启 。 下 一 步 是 将 部 分 PL/SQL 对 象 缓存 到 共享 
池 中 。 

9:05, 扩充 temp 表 空 间 完成 ,开始 实施 表 分 区 操作 。 在 做 表 分 区 的 同时 ， 日志 文件 开始 调 
整 。 日 志文 件 调整 采取 的 方法 是 先 删除 老 日 志 组 ， 然 后 创建 新 日 志 组 。 原 计划 是 分 区 表 调 整 完毕 
后 才 实 施 ， 为 了 节约 时 间 ， 日 志文 件 调 整 和 分 区 表 同 步 进行 。 

2:30; 分 区 表 重 组 完毕 ， 今 晚 的 调整 工作 基本 完成 ， 下 面 只 剩 下 表 分 析 工 作 了 。 重 启 了 
Listener ,小 孙 开 始 重启 应 用 。 不 到 3 : 00, 应 用 重启 完毕 。 下 一 步 就 是 校 验 应 用 了 。 到 目前 为 止 ， 
一 切 都 很 顺利 ， 只 要 确认 无 误 后 ， 就 可 以 完成 本 次 实施 了 。 大 家 都 坐 在 一 边 ， 等 着 最 后 的 结果 。 

应 用 服务 器 无 错误 信息 ，Pass; 

数据 库 警 告 日 志 正 常 ，Pass; 

应 用 软件 登录 正常 ，Pass; 

应 用 软件 日 志 无 报错 信息 ，Pass。 

好 像 一 切 都 很 顺利 ， 应 用 系统 正常 启动 了 。 大 家 都 十 分 兴奋 ， 看 样子 今天 的 工作 可 以 顺利 结 
RT. 

“有 问题 ， 这 个 界面 显示 不 出 来 " ， 小 孙 突 然 叫 了 起 来 ,气氛 一 下 子 紧 张 了 。 一 个 日 常 扎 账 查 
询 模 块 界面 显示 不 正常 。 从 应 用 日 志 上 看 不 到 任何 异常 ，WebLogic 的 日 志 上 也 看 不 到 错误 信息 。 
问题 十 分 严重 ， 目 前 已 经 快 4: 00 了 ,我 们 的 停机 窗口 到 8 : 00 结束 。 如 果 在 一 个 小 时 内 无 法 解 
决 问 题 ， 可 能 就 要 实施 应 急 预 案 了 。 到 底 是 哪个 环节 出 了 问题 呢 ? 

从 数据 库 警 告 日 志 上 没有 看 到 任何 疑点 ， 也 不 存在 无 效 的 PL/SQL 对 象 ， 索 引 都 是 正常 的 。 
好 像 一 切 都 很 正常 。 我 和 老 于 都 感觉 可 能 是 参数 调整 有 些 问题 ， 那 到 底 是 哪个 参数 出 了 问题 呢 ? 
既然 日 志 没有 任何 有 参考 意义 的 信息 , 那么 唯一 的 办 法 就 是 跟踪 应 用 了 。 而 现场 的 软件 维护 人 员 
根本 不 知道 这 个 模块 调用 了 哪些 SQL, 应 用 软件 也 没有 Trace 的 开关 ,唯一 的 办 法 就 是 使 用 10046 
来 跟踪 SQL 了。 我 和 老 肖 说 :“ 小 孙 ， 马 上 关闭 应 用 ， 把 连接 池 设 置 为 最 小 ， 然 后 把 整个 数据 库 
打开 10046 Trace， 看 看 到 底 有 什么 问题 。 

打开 10046 Trace 后 ， 问 题 很 快 就 找到 了 ， 有 一 个 访问 dblink 的 SQL 报 ORA-24370 错误 。 
通过 分 析 ， 发 现 这 是 由 于 一 个 JDBC 引擎 的 bug 引起 的 。 在 一 个 通过 dblink 访问 的 SQL 里 ， 如 
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果 使 用 了 绑 定 变 量 ,， 那 么 执行 SQL 时 会 报 ORA-24370 错误 。 实 际 上 , 这 个 SQL 没有 使 用 绑 定 变 
量 ， 而 将 cursor_sharing 设置 为 similar 后 ， 该 变量 被 转换 为 绑 定 变量 ， 所 以 执行 时 就 会 报 
错 。 看 来 cursor sharing 只 能 回 退 为 exact。 将 cursor sharing 参数 回 退 后 ， 故 障 果 然 消 
失 了 。 

凌晨 4 : 50， 应 用 测试 终于 完成 。 除 了 快 结束 时 的 小 插曲 ， 基 本 上 一 切 正常 。 大 家 都 松 了 一 
口气 。 张 工 看 样子 还 没有 从 刚才 紧张 的 气氛 中 缓 过 劲 来 ， 他 对 我 说 :“ 老 白 ， 你 们 以 前 搞 优 化 经 
第 磁 到 这 种 情况 吗 ? ”我 说 :“ 碰 到 这 种 情况 很 正常 ， 因 为 大 多 数 情况 下 都 设 办 法 在 优化 实施 前 
做 严格 的 应 用 测试 ， 有 些 优化 操作 本 身 就 是 有 风险 的 。 我 们 能 做 的 有 两 点 : 一 是 在 制订 方案 时 尽 
可 能 减少 这 种 风险 ;二 是 一 旦 出 现 异 常 ， 能 够 尽快 解决 ， 就 像 今 天 晚上 这 样 。 今 天 这 个 问题 ， 我 
们 已 经 考虑 了 Oracle 的 版 本 ，Oracle 9.2.0.5 是 不 会 有 这 个 问题 的 ,但 是 我 们 没 想到 的 是 ， 你 们 的 
应 用 服务 器 用 了 一 个 Oracle 8.1.7 的 JDBC 引擎 来 访问 数据 库 ， 而 没有 使 用 Oracle 9.2 的 JDBC 引 
擎 。 下 一 次 我 们 要 更 小 心 一 点 才 是 。” KL: “eI, 今天 真是 有 惊 无 险 ， Pet, AAS 
问题 定位 得 快 ， 否 则 明天 就 不 好 交代 了 。 对 了 ， 你 们 碰 到 过 回 退 的 情况 吗 ? ” 

我 回答 说 :“ 我 做 优化 倒是 没 磁 到 过 回 退 的 情况 ， 不 过 我 看 到 过 。 大 概 是 1 年 前 了 ， 我 在 一 
个 联通 的 客户 那 边 搞 调 优 。 正 好 那天 晚上 碰 到 客服 系统 升级 ， 升 级 完成 后 ， 进 行 压力 测试 时 ， 发 
现 性 能 出 现 问 题 ， 要 紧急 回 退 。 那 个 系统 是 CS 结构 的 ， 老 系统 必须 在 Windows 98 上 跑 ， 新 系 
统 必须 使 用 Windows 2000， 所 以 当天 晚上 把 所 有 的 Windows 98 系统 全 部 格式 化 掉 重 装 了 
Windows 2000。 要 回 退 必须 重新 将 所 有 的 客户 端 都 安装 上 Windows 98， 当 时 全 省 有 上 百 台 微机 
需要 回 退 。 后 来 动员 了 所 有 人 懂 点 电脑 的 人 都 来 安装 操作 系统 ,， 才 在 第 二 天 营业 前 完成 了 回 退 , 那 
次 才 叫 惊 心 动 网 。 连 我 都 被 动员 去 安装 了 两 套 Windows 98。” 听 到 这 个 故事 ， 张 工大 笑 了 起 来 : 
“幸亏 我 们 的 系统 是 三 层 结构 的 。 

和 张 工 他 们 分 手 , 回 到 酒店 已 经 快 6 : 00 了 。 明天, 哦 已 经 是 今天 了 , 我 还 要 去 营口 办 点 事 。 
看 样子 只 能 在 长 途 车 上 睡觉 了 。 

















o opa 


优化 实施 是 十 分 消耗 体力 的 。 不管 前 面 的 准备 工作 做 得 如 何 充 分 , 在 具体 实施 时 还 是 经 常会 
碰 到 一 些 问题 的 。 因 此 在 实施 团队 中 ， 应 该 做 好 分 工 ， 每 个 人 的 体力 也 要 合理 支配 。 比 如 ， 老 白 
在 这 次 优化 中 担任 的 是 后 备 的 角色 ,这 个 角色 虽然 不 是 实施 的 主力 , 但 却 十 分 重要 ， 因 此 也 往往 
会 由 经 验 丰 富 的 老手 来 担任 。 这 个 角色 的 主要 职责 是 出 现 问 题 时 出 面 解决 ,因此 在 优化 实施 之 初 ， 
担任 这 个 角色 的 人 一 定 要 充分 休息 , 没事 的 时 候 不 要 参与 到 实际 工作 中 去 。 既 然 有 了 分 工 ， 就 要 
充分 信任 自己 团队 的 其 他 人 。 如 果 你 的 定 力 足 够 ， 那么 别人 实施 时 你 就 找 个 地 方 睡觉 去 吧 。 一般 
来 说 ， 这 种 需要 超过 10 个 小 时 的 实施 项 目 ， 到 最 后 的 时 候 ， 往 往 是 体力 出 现 了 问题 ， 导 致 出 现 
昏 招 ， 所 以 参与 实施 的 每 个 人 都 要 在 前 一 天 睡 一 个 好 觉 。 
在 这 个 项 目 中 , 老 肖 负 责 实施 ， 老 于 负责 核查 监督 。 他 们 两 个 在 实施 时 需要 互相 协助 互相 提 
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ME, 特别 是 在 优化 实施 的 后 半 段 ， 人 虽然 比较 亢奋 ， 感 觉 不 到 困 乏 ， 不 过 那 时 候 人 的 体力 已 经 出 
现 了 问题 ， 也 是 最 容易 出 现 问题 的 时 候 。 可 能 有 人 问 了 ,为 什么 不 能 把 所 有 的 过 程 做 成 自动 化 脚 
本 ,直接 跑 脚本 就 行 了 。 实 际 上 ， 在 优化 实施 过 程 中 ， 经 常会 碰 到 一 些 问题 。 如 果 一 个 脚本 要 跑 
上 儿 个 小 时 ,那么 这 个 脚本 跑 下 去 ,一旦 出 现 了 什么 问题 ,那么 发 现 的 时 候 就 晚 了 。 脚 本 写 得 再 
好 也 不 如 人 的 眼睛 ,所 以 老 白 做 实施 时 一 般 还 是 十 分 谨慎 的 。 要 知道 我 们 面 对 的 系统 往往 都 是 十 
分 重要 的 系统 ， 一 旦 第 二 天 无 法 正常 营业 ， 那 问题 就 严重 了 。 


P SEEI) 升级 维护 窗口 的 确定 


我 经 常 看 到 一 些 DBA 的 实施 方案 写 得 相当 好 ， 也 十 分 详细 ， 不 过 这 些 方 案 里 面 对 升 级 维护 
窗口 的 设计 往往 存在 一 些 问题 。 在 一 个 升级 优化 工作 中 ， 如 何 设计 维护 窗口 呢 ? 有 经 验 的 DBA 
往往 会 尽 可 能 多 地 申请 维护 窗口 。 如 果 一 件 事情 要 做 2 个 小 时 ， 有 经 验 的 DBA 巴不得 申请 8 个 
小 时 的 维护 窗口 ， 而 一 个 没有 经 验 的 DBA 往往 会 把 自己 的 停机 窗口 设计 得 过 小 。 

一 般 来 说 , 设计 停机 窗口 时 , 一 些 比较 明确 的 操作 是 可 以 精确 确定 操作 时 间 的 , 这 方面 不 需 
要 做 匈 余 考虑 。 对 于 一 些 没有 经 过 严格 测试 的 操作 步骤 , 一 般 来 说 需要 根据 以 往 的 经 验 或 者 测试 
的 结果 ， 在 确定 这 种 操作 时 间 时 需要 设计 一 些 元 余 ， 根 据 实 际 情况 元 余 可 以 设计 为 20% 一 50%。 
在 总 的 维护 窗口 统计 出 来 后 ， 还 需要 增加 一 些 元 余 时 间 ， 以 防 在 实际 操作 过 程 中 出 现 意外 。 

在 设计 维护 窗口 时 ,也 要 充分 考虑 到 回 退 所 需要 的 时 间 。 维 护 窗 口 不 能 挤占 了 回 退 操作 的 时 
间 ， 无 论 停机 窗口 再 紧张 ， 也 要 预 留 出 足够 的 回 退 时 间 。 否 则 一 旦 出 现 问题 ， 就 没有 足够 的 时 间 
回 退 了 。 实 际 工作 中 做 回 退 操作 的 机 会 十 分 低 ， 不 过 小 概率 事件 不 等 于 不 发 生 的 事件 ， 回 退 时 间 
是 在 最 环 的 情况 下 保命 的 措施 ， 因 此 一 定 要 充分 预 留 。 


E 人 优化 小 技巧 ) 回 退 预案 的 作用 


在 今天 的 升级 过 程 中 使 用 了 回 退 操 作 。 不 过 由 于 事先 疫 有 做 好 充分 的 准备 ， 回 退 是 在 无 预案 
的 情况 下 做 的 ， 因 此 整个 过 程 显 得 有 点 惊 心 动 饱 。 最 后 还 是 在 几 个 老 鸟 丰富 的 经 验 下 ， 很 快 定位 
了 问题 。 通 过 回 退 cursor sharing 参数 ， 解 决 了 问题 。 如 果 这 件 事 让 一 个 经 验 不 是 很 丰富 的 
DBA 去 做 ， 那 么 今天 的 这 个 升级 只 能 以 失败 告终 。 

在 这 件 事 上 ,可 以 看 到 回 退 预案 的 重要 性 。 我 参与 过 很 多 大 大 小 小 的 升级 或 者 优化 项 目 , 这 
些 项 目的 实施 方案 都 十 分 周密 ， 不 过 总 的 来 说 ， 回 退 预案 这 方面 都 十 分 欠缺 ， 甚 至 绝 大 多 数 项 目 
中 根本 没有 考虑 回 退 预案 。 还 有 一 些 只 是 简单 的 几 句 话 : 实施 前 备份 系统 ， 如 果 出 问题 就 使 用 备 
份 系统 恢复 。 这 种 预案 几乎 是 没 用 的 ， 因 为 在 实施 过 程 中 ,不 仅仅 是 对 文件 和 数据 进行 修改 ， 回 
退 也 不 是 回 退 到 初始 的 状态 ,而 绝 大 多 数 情况 下 需要 做 的 回 退 操作 是 局 部 的 回 退 , 因此 针对 可 能 
发 生 的 情况 需要 设计 响应 的 预案 。 

比如 ， 我 们 这 次 操作 需要 涉及 cursor sharing 方面 的 操作 ， 那 么 和 cursor sharing fH 
关 的 一 些 预案 就 要 齐备 ， 包 括 可 能 出 现 的 一 些 问题 以 及 解决 方案 。 预 案 不 可 能 十 分 完备 ， 也 不 可 
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能 预见 到 所 有 可 能 存在 的 问题 ， 不 过 多 一 份 预案 ， 对 你 的 工程 就 是 一 份 保障 。 

我 参加 过 不 少 系统 的 上 线 护航 工作 。 在 参与 项 目 之 前 ， 我 都 会 了 解 本 次 护航 涉及 哪些 系统 、 
和 哪些 技术 相关 。 我 会 准备 好 所 需要 的 工具 以 及 一 些 故障 诊断 工具 和 脚本 ， 一 旦 出 现 问 题 ， 就 可 
以 马上 使 用 。2008 年 11 月 ， 我 参与 中 国 最 大 的 一 次 运营 商 系统 制 接 工作 。 在 前 一 天 ， 我 就 和 集 
成 商 的 DBA 一 起 准备 监控 环境 , 因为 我 不 是 铁人 , 不 可 能 连续 三 四 天 24 小 时 都 盯 着 系统 。 因 此 ， 
我 们 准备 好 了 针对 不 同 数据 库 的 监控 手段 , 针对 Oracle 9i 数 据 库 , 我 们 安装 了 一 台 OMS 服务 器 ， 
并 且 通 过 监控 录像 的 方式 对 其 主要 的 性 能 指标 进行 监控 。 针对 Oracle 10g 的 数据 库 , 由 于 有 ASH 
和 AWR， 所 以 省 了 不 少 心 。 一 旦 出 现 故 障 ， 可 以 通过 ASH 立即 进行 分 析 。 如 果 我 们 不 在 现场 ， 
也 可 以 通过 AWR 等 报告 来 回顾 故障 发 生 时 的 情况 。 

不 过 虽然 做 足 了 功课 , 还 是 有 意外 的 事情 发 生 。 我 们 负责 监控 的 割 接 相关 的 数据 库 均 没有 出 
现 明显 的 问题 ， 倒 是 本 地 网 的 一 个 RAC 数据 库 的 一 个 实例 突然 宕 了 ， 还 好 我 们 第 一 时 间 发 现 了 
这 个 问题 ， 并 且 及 时 重启 了 数据 库 。 通 过 检索 资料 库 ， 很 快 定位 了 故障 的 原因 。 由 于 处 理 及 时 ， 
定位 问题 准确 ， 甲 方 对 此 也 十 分 满意 。 快 速 定位 问题 的 诀窍 就 是 我 自己 的 知识 库 , 以 前 我 在 网 上 
收集 到 好 的 技术 资料 时 ， 都 会 存放 在 某 个 文件 夹 里 ,时 间 长 了 ,这 个 知识 库 就 很 难 检索 了 。 后 来 
发 现 Firefox 下 的 scrapbook 这 个 插件 可 以 十 分 方便 地 将 网 页 拖拉 到 特定 的 知识 库 里 面 , 并 且 这 个 
知识 库 可 以 创建 全 文 检索 索引 。 通过 全 文 检索 索引 就 可 以 很 容易 地 进行 关键 字 检 索 。 这 个 知识 
我 已 经 积累 了 一 年 多 了 ， 目 前 已 经 积累 的 文档 总 数 超过 4000 个 ,日常 维 护 工作 中 发 生 的 主要 问 
题 都 可 以 在 这 个 知识 库 中 搜索 到 。 
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昨天 晚上 一 夜 没 睡 , 经 历 了 凌晨 那 次 小 的 惊吓 后 ， 大 家 都 有 点 后 怕 。 回 酒店 的 路 上 ， 老 于 和 
我 都 还 瞳 自 庆幸 。 回 到 酒店 后 已 经 6 点 多 了 ， 如 果 这 个 时 候 睡 觉 ， 等 会 起 来 会 很 痛苦 ， 所 以 我 只 
是 稍微 身 了 一 下 ， 洗 了 个 澡 。 看 了 一 会 儿 “ 第 一 时 间 ”， 就 已 经 8 点 多 了 。 我 最 好 能 够 赶 早 班车 
去 营口 ， 才 不 会 影响 今天 的 工作 。 简 单 拿 了 两 件 衣服 ， 塞 在 电脑 包 里 ， 就 出 门 了 。 

刚 下 楼 就 看 到 老 于 他 们 三 个 人 在 楼 下 拦 出 租车 。 我 问 老 于 :“ 上 午 老 能 不 是 值班 吗 ， 大 家 怎 
么 不 休息 休息 ”。 老 于 说 :“ 不 太 放 心 ， 还 是 过 去 看 看 ， 下 午 再 睡觉 。 于 是 我 就 踏 老 于 他 们 的 车 
一 起 去 北 站 旁边 的 客运 总 站 。 我 的 运气 还 不 错 , 刚 到 客运 站 就 赶 上 有 辆 车 要 走 ， 连忙 和 司机 打 了 
招呼 就 去 买 票 。 

车 刚 开 出 没 多 久 , 我 抱 着 电脑 包 就 卉 和 昏 沉沉 地 睡 着 了 。 自 从 上 次 在 厦门 电脑 包 被 掉包 后 , 我 
就 不 敢 把 电脑 包 放 在 行李 架 上 , 每 次 坐 长 途 车 都 抱 着 电脑 包 。 车 刚刚 上 沈 大 高 速 ， 老 于 的 电话 就 
打 进 来 了 。 一 看 来 电 是 老 于 的 号 码 ， 我 就 感觉 可 能 是 系统 出 了 问题 。 

现在 的 时 间 是 早上 8 : 40, 今天 是 周末 ， 按 理 说 系统 的 负载 应 该 不 大 ， 但 是 从 8 : 30 开始， 
系统 的 CPU 突然 高 达 100%, VO 也 很 大 , 连 在 操作 系统 上 执行 ps 命令 都 感觉 有 点 慢 。 优 化 后 不 
但 没有 看 到 性 能 提升 ， 而 且 出 现 了 严重 的 性 能 问题 。 老 于 他 们 观察 了 一 下 ， 有 一 张 我 们 昨天 晚上 
做 了 分 区 的 大 表 出 现 了 大 量 的 全 表 扫 描 。 老 于 和 我 都 怀疑 是 不 是 分 区 导致 了 全 表 扫 描 呢 ? 我 们 在 
做 表 分 区 的 同时 , 所 有 的 索引 也 都 使 用 了 本 地 索引 , 按理 说 不 应 该 出 现 以 前 走 索 引 的 操作 改 走 全 
表 扫 描 的 问题 。 

我 仔细 想 了 一 下 ， 感 觉 按照 我 们 的 方案 不 应 该 会 出 现 执 行 计划 的 突变 ， 除 非 是 昨天 重建 完 
表 后 没有 做 分 析 。 昨 天 我 们 走时 表 分 析 并 没有 结束 ， 提 交 了 后 台 作业 后 就 离开 了 ， 会 不 会 是 分 
析出 现 了 错误 呢 ? 我 建议 老 于 他 们 检查 一 下 分 析 数 据 。 老 于 说 他 们 开始 也 怀疑 分 析 没 有 正常 完 
成 ， 老 能 刚刚 检查 过 ， 分 析 数 据 正 常 ， 并 且 采 样 比例 确实 是 30%， 应 该 疫 问 题 。 于 是 我 建议 他 
们 马上 检查 一 下 是 否 存 在 索引 失效 ， 或 者 某 个 分 区 索引 有 问题 。 老 于 说 他 们 已 经 检查 过 了 ， 那 
张 表 上 的 6 个 索引 全 部 都 是 正常 的 ， 而 且 分 析 数 据 也 很 正常 ， 按 照 30% 比 例 采 样 的 ， 采样 比例 
也 应 该 足够 。 

我 马上 打开 电脑 ,由 于 长 期 从 事 维护 工作 ， 所 以 一 般 来 说 在 旅途 中 , 我 的 电脑 都 处 于 待机 状 
态 ， 以 便 尽快 处 理 突 发 事件 。 打 开 电 脑 后， 首先 我 检查 了 保存 在 电脑 上 的 dba indexes 视图 的 
诗 息 。 在 做 优化 项 目 时 ,我 有 一 个 习惯 ,就 是 会 保存 每 个 阶段 的 主要 系统 视图 。 这 个 习惯 被 证 明 
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是 十 分 有 效 的 ， 已 经 多 次 帮助 我 发 现 问 题 。 

打开 Excel 后 ， 我 立即 发 现 有 些 不 对 。 因 为 在 我 的 记录 里 ， 这 张 表 有 7 个 索引 ， 而 刚才 老 于 
很 明确 地 说 6 个 索引 全 部 正常 。 于 是 我 立即 打 电话 询问 老 于 ， 那 张 表 上 到 底 有 几 个 索引 ， 到 底 是 
6 个 还 是 7 个 。 老 于 确认 说 只 有 6 个 索引 。 通 过 核对 ， 我 发 现在 目前 系统 里 , 比 5 月 13 日 采集 数 
据 时 少 了 一 个 索引 。 

老 于 他 们 使 用 OEM Top SQL 工具 抓 取 了 相关 SQL， 通 过 比较 SQL 的 WHERE 条 件 ， 可 以 确 
定 就 是 由 于 这 个 索引 缺失 引起 的 。 由 于 这 个 索引 的 缺失 , 造成 了 一 张 千 万 条 记录 的 表 的 访问 产生 
了 大 量 的 全 表 扫 描 ， 从 而 导致 CPU 出 现 了 严重 的 问题 。 按 照 我 提供 的 索引 字段 添加 遗失 的 索引 
Ja, CPU 使 用 率 又 然 下 降 ， 稳 定 在 30% 左 右 。 由 于 今天 是 周末 ， 所 以 无 法 推断 在 业务 高 峰 期 ， 
系统 性 能 是 否 有 所 改善 。 不 过 通过 对 一 些 常见 SQL 的 分 析 来 看 ， 无 论 是 物理 读 还 是 逻辑 读 ， 平 
均 每 次 执行 的 开销 都 有 明显 的 下 降 。 如 果 不 考 虑 排队 效应 ， 系 统 整体 负载 下 降 和 性 能 提升 是 肯定 
的 。 但 是 生产 环境 改善 效果 的 评估 还 需要 经 过 下 周 的 观察 才能 最 终 确 定 。 

问题 是 解决 了 ,但 是 为 什么 会 遗失 一 个 索引 , 这 个 确实 十 分 费解 。 老 肖 是 经 验 很 丰富 的 DBA, 
做 表 重 建 方法 也 不 会 存在 丢失 索引 的 可 能 。 表 重建 的 方法 , 首先 通过 工具 取出 建 表 的 相关 脚本 (可 
以 使 用 Toad 或 者 类 似 的 工具 ， 在 这 个 项 目 中 我 们 使 用 了 Toad) ， 然 后 将 表 重 命名 (AMAR 
引 )， 然 后 重建 表 ， 再 将 数据 用 INSERT /*+ APPEND */ SELECT.. .的 方法 从 原 表 中 导入 数据 。 
这 种 过 程 不 可 能 出 现 索引 丢失 。 旧 表 改 名 后 还 没有 删除 ， 因 此 老 于 他 们 比 对 了 改名 后 的 表 ， 发 现 
也 只 有 6 个 索引 ， 而 不 是 我 采集 的 7 个 索引 。 唯 一 的 可 能 是 我 采集 了 dba indexes 信息 后 ， 有 
人 删除 了 某 个 索引 。 

如 果真 有 人 在 我 们 实施 前 删除 了 一 个 索引 , 删除 索引 的 目的 是 什么 呢 ? 是 误 操作 还 是 有 什么 
其 他 意图 呢 ? 看 上 去 在 我 们 实施 前 有 人 删除 索引 是 唯一 的 可 能 了 , 但 是 处 于 这 种 多 方 参与 的 项 目 
中 ,团结 是 第 一 位 的 ， 因 此 我 们 决定 这 个 问题 到 此 为 止 。 如 果 客 户 要 追究 责任 ， 那 么 我 们 承担 下 
来 就 可 以 了 。 这 个 问题 就 不 再 升级 了 ， 否 则 追究 起 来 也 不 可 能 有 什么 结果 ,反而 会 在 几 个 团队 之 
间 形 成 不 友好 的 气氛 。 我 们 决定 只 是 通报 一 下 张 工 ， 由 于 某 个 SQL 造成 了 大 量 的 全 表 扫 描 ， 影 
响 了 性 能 ， 我们 紧急 处 理 , 添加 了 一 个 索引 ， 问 题 就 解决 了 。 其 他 问题 就 不 再 提 了 ， 反 正 问题 发 
现 得 早 ， 没 有 造成 太 大 影响 ,， 张 工 那 边 也 好 交代 。 看 来 今天 老 于 他 们 提前 去 现场 还 是 正确 的 ， 否 
则 这 个 问题 造成 的 影响 大 了 ， 就 不 好 处 理 了 。 

下 午 张 工 他 们 到 现场 转 了 一 圈 ， 系 统一 切 正常 ,下 面 各 个 营业 厅 也 没有 相关 的 投诉 ,看 样子 
我 们 担心 的 负面 影响 是 不 存在 的 ， 这 次 优化 基本 上 成 功 了 。 张 工 他 们 来 的 时 候 ， 老 于 还 是 按照 我 
们 商定 的 方案 ， 主动 把 添加 索引 的 问题 和 张 工 说 了 ， 由 于 发 现 及 时 ， 处理 得 当 ， 故 障 并 没有 造成 
明显 的 损失 , 所 以 张 工 也 建议 这 个 问题 不 要 升级 了 ， 只 是 下 次 优化 操作 时 要 注意 不 要 发 生 类 似 的 
情况 。 

晚上 和 客户 一 起 吃 完 饭 , 我 还 是 给 老 于 打 了 个 电话 , 问 问 现场 的 情况 。 老 于 下 午 对 一 些 主要 
的 SQL 都 进行 了 采样 。 通过 采样 比 对 , 这 些 SQL 的 平均 开销 和 平均 执行 时 间 都 有 了 较 大 的 改善 。 
不 过 有 一 些 Top SQL 由 于 周末 的 原因 ， 并 没有 执行 ， 不 过 老 于 他 们 还 是 对 部 分 执行 次 数 较 多 的 
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SQL 进行 了 手工 试 运行 ,运行 的 结果 也 颇 令 人 放心 , 这 些 SQL 或 多 或 少 都 有 所 改善 ， IO 和 缓冲 
区 获取 的 开销 均 有 一 定 幅 度 的 下 降 。 看 样子 周一 系统 应 该 会 出 现 较为 明显 的 改善 迹象 。 





OD š 
今日 点 评 


今天 老 白 的 好 习惯 又 一 次 发 挥 了 作用 。 每 次 做 优化 时 , 老 白 都 会 对 主要 的 数据 字典 进行 备份 ， 
并 且 用 Toad 将 这 些 字典 表 的 数据 用 Excel 格式 的 文件 保存 起 来 , 以 便于 今后 出 问题 时 核对 。 今天 
出 现 的 问题 正好 用 上 了 这 些 Excel 文件 。 通 过 这 些 文件 ， 很 快 就 定位 到 丢失 了 一 个 索引 。 

其 实 需要 留意 的 字典 表 主要 涉及 表 、 索 引 、 别 名 、 视 图 、 存 储 过 程 、 触 发 器 等 方面 。 


ENNIS) 使 用 HINT 优化 SQL 


HINT 是 一 种 SQL 优化 的 重要 手段 。 在 默认 情况 下 , SQL 的 执行 计划 和 优化 方案 是 数据 库 的 
优化 器 自动 完成 的 , 不 需要 编程 人 员 干 预 。 但 是 数据 库 优 化 器 的 优化 方案 和 执行 计划 不 总 是 最 优 
的 。Oracle 数据 库 提 供 了 开发 人 员 强 制 性 制订 优化 方案 的 方法 来 弥补 数据 库 优 化 器 在 这 方面 的 不 
足 ， 这 种 方法 就 是 使 用 HINT, 

HINT 的 使 用 方法 是 在 SQL 语句 中 插入 /*+ < 规则 > */ 这 样 的 提示 ， 这 些 提示 需要 放 在 
SELECT, UPDATE, DELETE 这 些 词 的 后 面 ， 比 如 : 


























SELECT /*+ FIRST ROWS */ * FROM T TEST WHERE R>10; 

要 注意 的 是 ，/*+ 一 定 要 连 写 ， 之 间 不 能 有 空格 ， 后 面 一 定 要 有 空格 〈 在 某 些 早期 版 本 中 ， 
缺少 空格 可 能 会 导致 HINT 失效 )。 另 外 ， 需 要 注意 以 下 儿 个 问题 。 

O 提示 将 使 语句 强制 执行 基于 成 本 的 优化 器 除了 提示 规则 外 )。 

a 如 果 表 名 包含 类 似 <schema> .<table> 或 <table>@<db_link> 这 样 的 格式 时 ， 在 HINT 
里 要 使 用 表 的 别名 。 

O 确认 相关 的 表 都 分 析 过 ， 并 且 最 近 一 次 分 析 能 够 反映 出 该 表现 在 的 状态 。 

Oracle 的 优化 器 各 有 特点 ，RULE 优化 器 是 完全 基于 规则 的 ， 在 今后 的 Oracle 版 本 中 将 逐渐 
Wk. FIRST ROWS 优化 模式 强调 的 是 以 最 快 的 速度 返回 第 一 批 数 据 , 而 不 考虑 综合 的 VO JF 
# ALL ROWS 优化 器 考虑 总 体 VO 最 小 ， 而 不 考虑 响应 速度 。CHOOSE 优化 器 是 在 几 种 优化 
器 中 选择 认为 是 最 优 的 方案 。 

优化 器 可 以 在 数据 库 级 进行 定义 〈 设 置 参数 ) ， 也 可 以 在 会 话 级 定义 。 通 过 下 列 语句 ， 可 以 
修改 会 话 的 默认 优化 器 : 

ALTER SESSION SET optimizer goal- rule | first rows | all rows | choose ; 

而 使 用 这 两 种 方法 修改 优化 器 模式 都 存在 一 定 的 局 限 性 。 对 于 不 同 的 SQL 语句 ， 可 能 需要 
使 用 不 同 的 优化 器 来 优化 。 我 们 可 以 通过 优化 器 HINT 来 规定 某 个 语句 使 用 某 种 优化 器 来 优化 。 

优化 模式 如 下 表 所 示 。 
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优化 模式 


说 明 





FIRST ROWS, ALL ROWS 
RULE 

ORDERED 

ORDERED PREDICATES 














强制 使 用 CBO FIRST ROWS, ALL ROWS 优 化 器 


尽 可 能 使 用 基于 规则 的 优化 器 


访问 表 的 顺序 按照 FROM 语句 中 的 顺序 





使 用 wHERE 语 句 中 的 顺 





序 来 确定 执行 计划 ， 不 通过 索引 键 值 来 评估 





视图 或 子 查 询 都 涉及 多 表 连 接 。 多 表 连 接 和 子 查 询 的 执行 计划 有 多 种 ,可 以 根据 语句 的 需要 
来 使 用 这 些 HINT 优化 独立 的 查询 。 


HINT 


说 明 





PUSH_SUBQ 


NO_MERGE (v) 








HASH SJ(v) 
MERGE SJ (v) 





PUSH JOIN PRED(v) 





NO PUSH JOIN PRED(v) 


都 在 比较 靠 后 时 被 执行 

















合并 视图 





让 子 查 询 尽 可 能 早 地 执行 。 通 常 状 态 下 (Oracle 7.2 及 更 高 版 本 ) ， 子 查询 





如 果 在 一 个 视图 上 设置 该 HINT， 禁止 子 查 询 和 父 查 询 合 并 。 如 果 在 使 用 该 
视图 的 父 查 询 中 使 用 该 提示 ， 禁 止 该 视图 被 合并 (Oracle 7.2 及 更 高 版 本 ) 

















放 在 一 个 NOT IN 子 查询 中 ， 把 一 个 子 查询 转 为 MERGE SORT (ANTI) 模式 去 进 
行 表 连 接 操作 (Oracle 7.3 及 更 高 版 本 ) 
类 似 上 面 ， 只 是 使 用 Hash 连 接 。 


例如 : SELECT .. WHERE deptno is not null AND deptno NOT IN (SELECT 











/*+ HASH AJ */ deptn 


把 EXISTS 子 查询 转 为 散 列 
把 EXISTS 子 查询 转 为 合并 








O awa) 





把 连接 模式 放 入 视图 中 


不 把 连接 模式 放 入 视图 中 





通过 HINT 我 们 还 可 以 定义 数据 的 访问 方式 ， 比 如 通过 索引 访问 、 全 表 扫 描 等 。 


HINT 





FULL (tab) 
CACHE (tab) 


NOCACHE (tab) 
ROWID (tab) 


CLUSTER (tab) 

HASH (tab) 

IDEX( tab index ) 
NDEX_ASC( tab index ) 
DEX DESC( tab index ) 


NDEX_COMBINE( tab il.. i5 





i 
I 
F 
INDEX_FFS( tab index) 
F 
Al 


ND_EQUAL (tab il.. i5 ) 
USE_CONCAT 

NO_EXPAND 

DRIVING_SITE (table) 


说 RH 
T x at 
如 果 表 大 小 小 于 cache_size_thresholda， 把 该 表 视 为 设置 了 cacHE 选 项 ， 
仅仅 当 使 用 FTS 时 才 有 效 
不 使 用 CACHE 选 项 
直接 使 用 ROWID 访 问 SELECT /*+ ROWID( table ) */ ... FROM tab WHERE 

















ROWID between '&1' and '&2'; 


使 用 CLUSTER 扫描 
使 用 HASH 扫 描 
指定 索引 





指定 索引 进行 范围 扫描 








使 用 降序 索引 进行 范 


围 扫描 








使 用 全 索引 快速 扫描 


区 代 FTS 


使 用 多 个 位 图 索引 的 结合 来 访问 某 个 表 








取 多 个 独立 索引 的 交集 ， 可 以 取代 复合 索引 


使 用 UNION ALL 标 代 o 
不 要 使 用 USE_CONCAT 


R 或 者 IN 





强制 查询 在 表 所 在 的 市 点 进行 
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表 连 接 有 很 多 种 方式 , 不 过 Oracle 的 优化 器 很 可 能 会 选择 错误 的 表 连 接 方式 。 如 果 碰 到 这 种 
情况 ， 我 们 可 以 通过 下 面 的 提示 来 进行 优化 。 






























































































































































HINT 说 明 
USE NL (tab) 把 tab 作 为 符 套 循环 的 驱动 表 ， 只 有 在 使 用 ORDERED 时 才 有 用 
USE MERGE (tab. . ) 在 一 个 排序 -合并 连接 中 使 用 eab 作 为 驱动 表 ， 只 有 使 用 ORDERED 时 才 有 用 
USE HASH(tabl tab2) 使 用 Hash 连 接 tab1 和 tab2 
STAR 如 果 可 能 ， 使 用 星 型 连接 
STAR TRANSFORMATION 如 果 存 在 星 型 连接 ， 选 择 一 个 最 佳 的 连接 方式 
并 行 方 面 的 操作 也 可 以 通过 下 列 提示 来 指定 。 
HINT 说 明 
PARALLEL (table, <degree> [, <instances>] ) 使 用 并 行 访问 某 个 表 
PARALLEL INDEX(table, [index, 在 分 区 索引 上 使 用 并 行 范围 扫描 
[ degree [,instances] ] ] ) 
PO DISTRIBUTE(tab, out, in) 选择 在 一 个 并 行 查询 中 分 发 某 个 表 的 方法 (out 和 in 的 取 值 
范围 : hash/none/broadcast/partition) 
NOPARALLEL (table) 在 某 个 表 扫 描 时 不 使 用 并 行 
NOPARALLEL INDEX(table [,index]) 在 索引 扫描 时 不 使 用 并 行 
除了 上 述 提 示 外 ， 还 有 一 些 提 示 也 是 十 分 有 用 的 。 
HINT 说 明 
APPEND 在 INSERT. . .SELECT 时 有 效 ， 人 允许 INSERT 使 用 类 似 DIRECT LOAD 的 机 制 
NOAPPEND 不 使 用 APPEND 
REWRITE (v1[,v2]) Oracle 8.1 以 后 新 增 功 能 ， 如 果 MV 在 列表 中 就 使 用 ， 不 在 列表 中 就 使 用 符合 条 件 的 MV 
NOREWRITE Oracle 8.1 新 增 功能 ， 不 重 写 查 询 


比如 APPEND 是 我 们 在 INSERT. . .SELECT 语句 中 常用 的 提示 。 使 用 APPEND 提示 可 以 在 高 
水 位 以 上 的 部 分 插入 数据 ， 从 而 减少 INSERT 语句 的 成 本 ， 大 大 提升 SQL 的 效率 。 














5 


68108. 使 用 自动 采样 比例 引发 的 故障 


由 于 营口 的 事情 比较 复杂 ， 原 本 准备 周一 回 沈阳 ， 只 能 推迟 一 天 了 。 周 一 的 时 候 ， 听 老 于 说 
系统 情况 很 好 ,调整 过 的 系统 都 有 较 明显 的 改善 。 CPU 下 降 了 15%—20%, WO 也 有 明显 的 改善 ， 
所 有 指标 都 处 于 正常 范围 ， 内 存 还 剩余 1GB 左右 ， 这 些 改善 都 为 下 一 步 优 化 提供 了 很 好 的 基础 。 
虽然 我 对 这 个 效果 早 有 预期 , 但 是 听 到 这 个 消息 仍然 很 高 兴 。 由 于 沈阳 那 边 都 很 顺利 ， 我 决定 在 
营口 多 停留 一 天 ， 所 以 周二 在 长 途 大 巴 上 时 ， 我 的 心情 还 是 挺 放 松 的 。 一 般 来 说 ， 系 统 从 8 : 30 
开始 压力 加 大 ，9 : 30 左右 是 一 天 中 最 高 峰 的 时 段 ， 直 到 11 : 30 午休 时 压力 会 下 降 一 些 ， 下 午 
3 : 00 一 4 : 00 又 是 一 个 业务 高 峰 , 这 个 高 峰 持续 到 5 点 多 逐渐 减弱 , 不 过 5 : 40 £ 6 : 00 之 间 由 
于 营业 扎 账 , 客服 系统 和 收费 系统 会 出 现 一 个 短暂 的 压力 高 峰 。 这 种 现象 被 做 优化 的 人 称 为 系统 
的 市 奏 。 掌 握 系 统 市 奏 在 优化 分 析 中 十 分 关键 。 

大 巴 开车 时 是 早上 8 : 00, 现在 已 经 接近 9 : 00 了 ， 还 没有 接 到 “骚扰 ”电话 ， 说明 一 切 正 
第 。 经 过 周一 的 考验 后 ， 我 对 优化 的 效果 还 是 有 信心 的 。 回 到 沈阳 已 经 快 11 : 00 了 ， 我 一 进 办 
公 室 就 感觉 气氛 十 分 紧张 。 老 于 和 老 熊 正在 紧张 地 敲 着 键盘 ， 老 肖 昨 天 已 经 回 北京 了 ， 目 前 沈阳 
只 有 老 于 和 老 熊 值守。 

看 到 我 进来 ， 老 于 马上 跑 过 来 说 :“ 老 白 ， 我 昨天 晚上 干 了 一 件 春 事 ， 周 一 下 午 和 开发 商讨 
论 定 期 分 析 表 和 索引 时 ， 开 发 商 认为 分 析 一 遍 所 有 的 表 时 间 太 长 ， 能 不 能 让 分 析 速 度 加 快 一 点 。 
我 找 了 一 下 Oracle 9i 的 相关 资料 ， 发 现 doms. stats.gather table stats 的 采样 比例 参数 有 
一 个 值 , 就 是 自动 采样 比例 。 我 就 考虑 用 Oracle 9i 的 自动 采样 比例 。 我 在 自己 的 数据 库 上 做 了 个 
测试 ， 发 现 使 用 自动 采样 比例 分 析 很 快 。 想 今天 验证 一 下 自动 采样 比例 是 否 可 行 ， 就 对 一 张 有 
2 000 万 条 记录 的 表 做 了 一 个 实验 ， 今 天 这 张 表 相关 的 业务 就 出 问题 了 。 今 天 早上 10 : 30 开始 ， 
有 一 个 SQL 导致 这 张 表 的 全 表 扫 描 , CPU 产生 了 严重 的 瓶颈 , 现在 系统 基本 上 处 于 不 可 用 状态 。 

开发 商 的 维护 人 员 小 孙 已 经 通过 电话 咨询 开发 人 员 ， 确 认 了 这 个 SQL 是 由 一 个 叫 “ 机 打发 
票 ”的 程序 产生 的 ， 这 个 应 用 每 个 月 只 有 出 账 后 的 几 天 使 用 ， 一 般 就 是 8 日 、9 日 ， 这 个 程序 主 
要 用 于 批量 打发 票 。 由 于 我 们 是 11 日 才 进 场 的 ， 所 以 我 们 没有 采样 到 这 个 SQL。 这 个 SQL 正好 
使 用 了 昨天 老 于 做 自动 采样 分 析 的 那 张 大 表 , 老 能 也 确定 是 由 于 执行 计划 不 正确 导致 的 问题 ， 目 
前 这 张 表 的 采样 比例 是 35%。 老 能 建议 立即 对 这 张 表 做 重新 分 析 ， 不 过 采样 比例 他 没有 把 握 ， 建 
议 30%。 我 考虑 了 一 下 ， 建 议 马 上 使 用 20% 比 例 采 样 ， 分 析 一 下 表 ， 和 暂时 就 不 要 带 cascade 参数 
了 ， 索 引 今天 晚上 找 时 间 再 分 析 。 
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老 能 的 脚本 都 已 经 准备 好 了 ,， 听 了 我 的 建议 后 ， 马 上 调整 了 参数 ， 开 始 对 表 进 行 分 析 。 老 能 
刚 分 析 完 这 张 表 ， 正 准备 测试 一 下 那个 SQL 的 执行 计划 是 否 改善 了 ， 突 然 发 现 数据 库 不 可 访问 
了 。 我 们 正 准 备查 查 数 据 库 是 否 宕 了， 服务 器 也 连 不 上 了 。 开 发 商 的 小 孙 告 诉 我 们 ,维护 组 那 边 
决定 重启 服务 器 了 。20 分 钟 后 ， 服 务 器 重启 完成 ， 应 用 也 重新 装载 了。 系统 重启 以 后 ， 一 切 恢 
复 了 正常 ， 查 看 那个 SQL， 执 行 计划 完全 正确 ， 全 表 扫 描 消失 了 ，CPU 使 用 率 又 恢复 到 60% ~ 
70%, VO 情况 也 十 分 正常 ，WIO 在 10% 左 右 。 

大 家 刚刚 松 了 一 口气 ， 孙 主任 和 张 工 他 们 急匆匆 地 走 了 进来 Ui: "ET. BA, RIFA 
小 会 ， 把 刚才 的 问题 分 析 一 下 。” 

原来 今天 的 问题 影响 很 大 , 连 孙 主 任 也 被 从 总 经 理 办 公会 议 的 会 场 找 回 办 公 室 , 集成 商 那 边 
分 析 认 为 有 一 张 近 100 万 记录 的 表 上 少 了 一 个 索引 ,导致 了 今天 的 性 能 问题 ， 所 以 他 们 新 建 了 一 
个 索引 ， 并 且 重 启 了 服务 器 ， 问 题 就 解决 了 。 孙 主任 介绍 完 情况 后 又 问 我 :“ 老 白 ， 你 以 前 提出 
过 这 个 服务 器 只 有 2 CPU, 已 经 很 难 承担 目前 的 业务 量 了 , 建议 我 们 扩容 。 这 个 扩容 是 不 是 特 
NAA? AAA TR. 那么 我 们 可 以 加 快 采购 的 进度 。 采购 CPU 的 事情 我 们 已 经 在 走 流程 了 ， 
不 过 到 货 还 要 半 个 多 月 ， 如 果实 在 来 不 及 ,我 们 也 可 以 考虑 买 水 货 ， SRE. 你 们 作为 优化 厂 
商 ， 有 什么 问题 ， 不 要 看 我 们 这 边 的 眼色 ， 该 怎么 样 就 怎么 样 。 开 发 商 认 为 CPU 已 经 承受 不 了 
了 ， 他 们 多 次 提出 扩容 ， 只 是 你 们 前 一 阵子 说 通过 6 H 6 日 的 优化 可 以 解决 CPU 的 问题 ， 我 们 
才 没 有 对 CPU 采购 加 急 。” 

看 得 出 来 ， 孙 主任 是 真 急 了 ， 他 也 认为 今天 的 问题 是 由 于 CPU 瓶颈 造成 的 。 于 是 我 把 刚才 
问题 的 原因 原原本本 地 和 和 孙 主 任 汇报 了 ， 老 于 也 向 孙 主 任 表示 抱歉 。 我 说 ,问题 的 关键 不 在 于 开 
发 商 加 的 那个 索引 ， 而 是 由 于 表 分 析 采 样 比例 不 足 导致 SQL 执行 计划 的 改变 ， 因 为 这 个 业务 昨 
天 就 有 人 在 做 ,而 昨天 系统 都 很 正常 ,昨天 晚上 老 于 重新 分 析 了 这 张 表 , 今天 才 出 现 问 题 的 。 系 
统 扩容 虽然 是 必需 的 , 但 是 由 于 我 们 优化 的 效果 还 不 错 , 一 个 月 之 内 , 系统 不 会 出 现 明显 的 瓶颈 ， 
半 个 多 月 的 采购 周期 不 会 有 太 大 的 影响 ， 他 们 可 以 按照 原来 的 采购 计划 进行 。 

最 后 ， 我 说 :“ 孙 主任 ， 今 天 的 问题 ， 其 实 是 我 们 的 失误 造成 的 ， 不 过 也 是 我 们 解决 的 ， 重 
启 服务 器 和 添加 索引 并 不 能 真正 解决 问题 。” 

孙 主 任 说 :“ 不 管 怎么 样 ， 开 发 商 认为 他 们 加 了 索引 重启 了 服务 器 就 解决 问题 了 ， 所 以 你 们 
也 不 要 过 于 矫情 了 ， 这 个 问题 就 算是 人 家 解决 的 吧 。 明 天 例会 时 ， 也 不 要 提 谁 解决 的 了 ， 关 键 是 
这 种 事情 不 能 再 发 生 了 。” 

中 午 吃 午饭 时 ， 老 于 还 在 讨论 自动 采样 比例 的 事情 ， 老 于 说 :“ 我 搞 了 Oracle 差不多 10 年 ， 
大 多 数 时 间 玩 的 都 是 Oracle 8i, Oracle 9i 的 新 技术 用 的 不 是 很 多 ， 而 且 我 从 来 对 新 技术 都 是 小 心 
村 村 的 ， 这 回 偶尔 玩 了 一 下 新 技术 ， 就 玩 出 了 毛病 ， 下 回 更 不 敢 随 便 玩 了 。” 

是 啊 , 新 技术 是 好 东西 , 但 是 又 有 多 少 人 在 用 之 前 弄 明 白 了 呢 ? 连 老 于 这 么 谨慎 的 人 都 会 禁 
不 住 诱惑 去 使 用 自动 采样 比例 , 这 是 Oracle 的 官方 文档 对 自动 采样 比例 的 吹 咕 太 夸 大 其 词 了 。 实 
bs E, 采用 自动 采样 比例 出 现 问 题 的 案例 比比 皆 是 , 如 果 不 经 过 严格 的 测试 , 绝对 不 能 随便 使 用 。 
老 能 在 旁边 补充 说 :“ 不 管 怎么 样 ， 我 做 表 分 析 ， 采 样 比例 一 般 尽量 选择 高 一 些 ， 小 表 40% 以 上 ， 


















































6 月 10 日 使 用 自动 采样 比例 引发 的 故障 221 





大 表 30% 以 上 ， 这 样 出 问题 的 可 能 性 比较 小 。” 

对 于 表 分 析 的 采样 比例 ,确实 没有 一 个 很 严格 的 标准 ,不 过 出 于 安全 考虑 ， 对 于 没有 经 过 测 
试 的 系统 ， 最 好 不 要 使 用 较 低 的 采样 比例 ， 老 能 这 种 做 法 是 比较 安全 的 。 一 般 来 说 , 采样 比例 低 
于 10% 是 比较 危险 的 。 不 过 有 些 系 统 由 于 数据 量 很 大 , 采用 较 大 的 采样 比例 不 太 现实 , 这 种 情况 
下 就 需要 做 足 测试 。 如 果 试 验证 明 5% 的 采样 比例 是 安全 的 ， 那 么 也 确实 没有 必要 去 使 用 30% 的 
采样 比例 了 。 
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今天 是 由 于 老 于 尝试 使 用 自动 采样 比例 导致 了 一 张 重要 的 表 采 样 比例 过 低 ， 大 量 SQL 的 执 
行 计划 出 现 了 问题 ， 从 而 导致 系统 性 能 问题 。 老 白 经 常 强调 DBA 不 能 太 好 奇 。 实 际 上 ， 今 天 这 
种 问题 完全 是 可 以 避免 的 。 原 本 第 一 次 优化 的 效果 十 分 不 错 ， 没 必要 再 去 画蛇添足 了 , 但 是 有 时 
候 人 还 是 很 脆弱 的 , 经 常会 做 一 些 莫 名 其 妙 的 事情 。 老 于 事后 也 说 不 知道 为 什么 前 天 晚上 他 就 做 
了 这 件 事 ， 导 致 了 这 种 后 果 。 老 白 也 曾经 碰 到 过 一 件 事情 ， 差 点 导致 严重 的 后 果 。 当 时 在 一 个 客 
户 那里 帮助 客户 做 一 个 健康 性 检查 ， 所 有 的 活 都 干 完了 ,报告 也 写 完 了 。 按 理 说 这 个 时 候 我 和 客 
户 提出 今天 的 活 干 完 了 ， 客 户 也 不 会 有 什么 意见 。 不 过 上 午时 昕 客户 说 他 们 的 系统 经 常会 
ORA-4031， 健 康 检查 时 也 确实 看 到 了 几 份 ORA-4031 的 日 志 ， 所 以 突然 想 帮 客户 分 析 一 下 共享 
Ab. 我 手头 的 一 套 分 析 共 享 池 的 脚本 , 在 Oracle8、Oracle 9、Oracle 10.2 上 都 用 过 , 没什么 问题 ， 
因此 也 很 自信 地 跑 了 一 下 。 当 时 的 环境 是 Oracle 10.1.0.2， 脚 本 跑 了 一 分 多 钟 ， 突 然 客 户 跑 过 来 
说 系统 挂 了 ， 让 我 帮助 看 看 。 我 立马 看 了 看 我 跑 的 脚本 ， 发 现 是 我 的 脚本 导致 了 系统 挂 起 ， 虽 然 
两 三 分 钟 内 我 就 杀 掉 了 进程 ， 解 决 了 这 个 问题 ， 不 过 后 来 想 想 确实 是 挺 县 的。 虽然 你 帮 客 户 做 一 
些 额外 的 工作 是 出 于 好 意 , 不 过 你 的 好 意 可 能 会 带 来 负面 效果 。 有 时 候 风 险 的 评估 往往 会 超出 我 
们 知识 的 范围 ， 这 个 时 候 就 要 十 分 小 心 了 。 


OMENS) 关于 表 分 析 比 例 的 判定 


经 常 有 客户 问 我 表 分 析 比 例如 何 判定 。 实 际 上 ,， 针 对 不 同 的 应 用 系统 ， 确 实 疫 有 一 个 标准 答 
案 。 对 于 不 同 的 应 用 系统 ， 都 需要 做 严格 的 验证 。 实 际 上 表 分 析 采 样 比例 主要 取决 于 数据 分 布 的 
均匀 程度 。 对 于 十 分 均匀 的 表 ， 采 样 比例 小 一 点 ， 都 可 以 获得 较为 准确 的 结果 ， 而 对 于 数据 分 布 
不 均匀 或 者 某 个 字段 的 值 存在 严重 倾斜 的 情况 ， 采 样 比例 就 要 高 一 点 。 

对 于 一 些小 系统 来 说 ， 在 维护 窗口 中 做 一 次 100% 的 分 析 是 没有 任何 问题 的 ， 因 此 这 类 系统 
可 以 采用 100% 采 样 。 而 对 于 一 些 海量 系统 来 说 ， 能 够 采用 较 低 的 采样 比例 来 确保 执行 计划 不 出 
问题 ,那么 尽 可 能 地 使 用 较 低 一 点 的 采样 比例 。 一 般 来 说 , 每 张 表 的 最 低 采 样 比例 的 测试 ， 最 好 
在 系统 上 线 前 或 者 上 线 后 不 久 就 完成 ， 今 后 只 需 对 某 些 表 进 行 微调 。 

而 实际 工作 中 , 我 们 往往 没有 那么 幸运 , 因为 我 们 面 对 的 系统 往往 都 是 已 经 运 
系统 。 在 这 种 情况 下， 如果 有 个 客户 由 于 数据 量 增长 ， 无 法 保证 100% 采 样 ， 和 希望 
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意 , 给 出 一 个 最 低 采 样 比例 的 建议 , 那么 你 将 面临 一 个 巨大 的 挑战 。 因 为 你 面 对 的 可 能 是 一 个 十 
分 关键 的 业务 系统 ， 一 旦 出 现 问题 ， 将 万 劫 不 复 。 如 果 遇 到 这 样 的 挑战 ， 你 将 如 何 面 对 呢 ? 

想 要 回答 这 个 问题 确实 比较 难 。 我 们 不 能 拍 着 脑袋 阅 ， 采 样 比例 30% 合 适 还 是 50% 合 适 。 最 
好 的 办 法 是 在 生产 系统 上 进行 测试 ， 比 如 先 测 试 20%， 如 有 果 系 统 中 主要 SQL 的 执行 计划 都 正确 ， 
那么 说 明 这 个 采样 比例 是 适合 的 ,否则 就 增加 采样 比例 再 进行 测试 。 这 个 方法 听 起 来 不 错 ,不 过 
有 经 验 的 老 DBA 早 就 吐 之 以 血 了 。 核 心 的 生产 系统 是 不 能 让 你 这 么 折腾 的 ， 而 且 如 何 判 断 “ 主 
要 SQL 的 执行 计划 没有 改变 ”也 不 是 一 件 容 易 的 事情 。 

既然 无 法 在 生产 系统 中 做 这 个 测试 , 那么 就 必须 在 测试 环境 中 做 了 。 我 们 对 测试 环境 有 什么 
要 求 呢 ?通过 一 个 逻辑 备份 ,将 数据 导入 到 测试 库 中 是 否 可 行 呢 ”答案 是 否定 的 。 逻辑 备份 恢复 
的 数据 ,在 数据 块 中 的 数据 分 布 方面 已 经 进行 了 重组 ,无 法 充分 反映 出 生产 库 中 的 数据 分 布 情况 ， 
因此 多 辑 备 份 恢复 的 数据 可 以 反映 出 一 部 分 生产 库 的 情况 , 而 不 是 全 貌 。 我 们 必须 在 物理 结构 完 
全 一 致 的 数据 上 做 测试 ， 才 能 得 到 最 为 准确 的 结果 。 在 物理 standby 数据 库 上 进行 测试 是 最 佳 的 
选择 。 如 果 没 有 物理 standby 数据 库 , 使 用 rman 备份 的 备份 集 恢复 一 套数 据 库 , 也 是 不 错 的 选择 。 

一 旦 你 拥有 了 一 套 测 试 环境 ， 就 可 以 进行 所 需要 的 测试 了 。 除 了 使 用 SQL 直接 验证 采样 比 
例 的 影响 外 , 直接 比 对 采样 结果 也 是 很 常用 的 方法 。 如 果 使 用 不 同 的 采样 比例 得 到 的 采样 结果 类 
似 ， 那 么 选择 较 低 采样 比例 的 风险 也 相对 较 小 。 比 对 采样 比例 时 还 要 注意 ， 不 仅仅 要 比 对 
dba tables, dba indexes 中 的 结果 ， 还 要 比 对 dba tab columns 中 主要 字段 的 统计 数据 ， 
因为 这 些 数 据 对 于 执行 计划 中 计算 成 本 影响 极 大 。 


E 人 优化 小 技巧 ) AIX 下 使 用 vmstat 分 析 VO 问题 的 小 技巧 


一 般 DBA 喜欢 使 用 vmstat 命令 来 查看 系统 的 状态 。 如 果 问 起 vmstat 中 b 的 含义 ， 可 能 
大 家 都 很 清楚 。p 表示 资源 等 待 队列 的 长 度 。 从 某 种 程度 上 来 说 ，b 等 待 可 以 和 VO 等 待 等 挂钩 ， 
如 果 数 据 库 使 用 文件 系统 作为 数据 文件 的 存储 方式 的 话 。 但 是 对 于 裸 设备 来 说 , 裸 设备 出 现 等 待 
并 不 会 明显 地 体现 在 b 队列 上 。 

在 AIX 下 提供 了 一 个 -I 选项。 使 用 该 选项 ， 可 以 看 到 一 个 p 值 ，p 值 代表 物理 UO 线程 等 
待 队列 的 长 度 。 如 果 p 队列 的 长 度 较 大 ， 那 说 明 存储 系统 的 性 能 存在 问题 。 


vmstat -I 1 10 













































































System configuration: lcpu=48 mem=96256MB ent=24.00 


kthr memory page faults cpu 

rop p avm fre fi fo pi po fr sr in sy cs us sy id wa pc ec 
4 0 2 12901682 9358723 0 0 0 0 0 0 5049 49005 11774 14 1 82 4 4.17 17.4 
1 0 6 12901699 9358706 0 0 0 0 0 0 5232 51973 12165 14 181 3 4.35 18.1 
4 0 8 12901708 9358697 0 0 0 0 0 0 4933 48704 12880 12 1 83 3 3.81 15.9 
4 0 6 12901689 9358716 0 0 0 0 0 0 5068 44568 12505 12 1 83 3 3.84 16.0 
3 0 4 12901666 9358739 0 0 0 0 0 0 5936 50968 14031 12 1 84 3 3.76 15.7 
6 0 2 12901687 9358718 0 0 0 0 0 0 6205 54103 14774 12 1 83 3 3.79 15.8 
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2 0 0 12901688 9358717 0 0 0 0 0 0 6541 56430 15516 13 283 3 3.99 16.6 
2 0 412901678 9358727 0 0 0 0 0 0 6514 54752 14903 13 2 83 3 3.96 16.5 
4 0 012901670 9358735 0 0 0 0 0 0 6270 57911 14686 12 184 2 3.88 16.2 
5 0 6 12901667 9358738 0 0 0 0 0 0 7369 59685 15826 13 2 83 2 4.17 17.4 


在 这 种 情况 下 ， 可 以 分 析 一 下 pbuf 是 否 存在 不 足 的 现象 。 具 体 方法 是 使 用 vmstat -v, d 
看 是 否 存在 较 多 的 pouf 阻塞 等 待 。 


vmstat -v 
24641536 
23657185 
9356511 
8 
1889295 
80.0 
5.0 
15.0 
9:79 
2357564 
0.0 
0 
9.9 
10.0 
2357564 
0 
2796 
0 
2228 
2315 
5311 
0 
0.00 





memory pages 

lruable pages 

free pages 

memory pools 

pinned pages 

maxpin percentage 

minperm percentage 

maxperm percentage 

numperm percentage 

file pages 

compressed percentage 

compressed pages 

numclient percentage 

maxclient percentage 

client pages 

remote pageouts scheduled 

pending disk I/Os blocked with no pbuf 
paging space I/Os blocked with no psbuf 
filesystem I/Os blocked with no fsbuf 

client filesystem I/Os blocked with no fsbuf 
external pager filesystem I/Os blocked with no fsbuf 
Virtualized Partition Memory Page Faults 
Time resolving virtualized partition memory page faults 


实际 上 ,小 小 的 vmstat 中 还 包含 了 十 分 多 的 门道 ,用 好 它 可 以 为 我 们 提供 非常 多 的 有 效 信 
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6 月 11 日 R 阶 段 总 结 


MWS = 


今天 本 来 是 例会 时 间 ， 由 于 前 一 段 时 间 刚 刚 做 了 优化 ， 需 要 做 一 个 全 面 的 汇报 ， 小 齐 也 专程 
从 北京 过 来 一 起 参加 ， 这 次 会 议 也 改 为 优化 的 阶段 总 结 会 。 虽 然 优化 效果 十 分 明显 ， 第 一 次 调整 
基本 上 达到 了 我 们 的 预期 目标 ， 系 统 性 能 有 了 较 大 的 改善 ,甚至 大 部 分 性 能 指标 远 远 超 出 了 我 们 
的 预期 , 但 是 由 于 出 现 了 昨天 的 系统 故障 , 给 客户 造成 了 十 分 不 好 的 影响 ， 所 以 大 家 的 情绪 都 有 
点 低落 。 

开会 前 我 们 儿 个 人 单独 讨论 了 一 会 ， 大 家 都 觉得 如 何 解 释 昨 天 的 问题 是 一 个 十 分 关键 的 问 
题 。 如何 让 客户 正确 地 认识 到 这 次 调整 的 效果 ,从 而 对 我 们 后 面 的 工作 建立 信心 也 是 十 分 重要 的 。 
优化 项 目 实施 过 程 中 十 分 怕 出 问题 , 每 次 出 问题 ,客户 对 你 的 信任 就 会 下 降 ， 严重 时 甚至 可 能 
现 客户 的 对 立 情绪 ， 如 果 到 了 这 一 步 ， 下 面 的 工作 就 很 难 开展 了 。 

今天 是 孙 主 任 主持 会 议 , 他 首先 发 言 。 不 过 他 除了 对 开发 商 昨 天 快速 反应 最 终 解 决 问题 提出 
了 表扬 外 , 没有 再 提 到 昨天 的 事故 。 孙 主任 中 肯 地 评价 了 这 段 时 间 大 家 的 工作 成 果 ， 也 表示 他 们 
对 优化 项 目 最 终 的 成 功 充满 了 信心 ， 并 希望 我 们 在 今后 的 工作 中 能 够 更 加 细致 :“ 优 化 本 身 就 是 
曲折 前 进 的 过 程 ， 在 这 个 过 程 中 肯定 会 出 现 一 些 反复 ， 甚 至 出 现 严重 的 倒退 ,但 是 只 要 大 家 的 目 
标 一 致 ， 实 现 目 标的 手段 是 正确 和 合理 的 ， 那 么 最 终 的 结果 肯定 是 好 的 。 对 这 一 点 我 深信 不 疑 ， 
所 以 大 家 不 要 怕 ， 继 续 治 着 我 们 规划 好 的 路 子 走 ， 这 个 项 目 成 功 现在 就 能 看 得 见 ， 起 码 我 已 经 看 
到 了 和 希望 。 
在 这 种 情况 下 ， 作 为 客户 方 的 领导 ,能够 说 出 这 种 话 ， 是 我 们 万 万 想不到 的 。 大 家 听 了 和 孙 主 
任 的 发 言 ,心里 都 有 些 感动 ， 其 至 我 的 眼眶 都 有 些 湿 泣 。 我 做 过 儿 十 个 类 似 的 项 目 , 但 是 有 这 种 
感动 还 是 第 一 次 。 作 为 项 目 甲 方 的 第 一 责任 人 ， 昨 天 我 们 的 失误 给 他 带 来 的 压力 是 可 想 而 知 的 。 
但 是 这 些 压 力 他 一 个 人 承担 下 来 了 , 没有 对 我 们 有 一 丝 一 亳 的 抱怨 , 给 与 我 们 的 只 有 鼓励 和 信任 ， 
这 一 点 太 难 能 可 贵 了 。 有 了 这 份 支持 ， 我 们 如 果 还 做 不 好 的 话 ， 那 么 就 太 不 应 该 了 。 

今天 我 们 也 给 客户 带 来 了 一 个 惊喜 , 在 会 议 前 我 们 也 讨论 了 这 个 问题 要 不 要 放 到 今天 的 例会 
上 去 讨论 ， 后 来 还 是 决定 在 这 次 会 议 上 把 这 个 惊喜 拿 出 来 ， 也 给 大 家 一 点 信心 。 这 几 天 老 能 已 经 
找到 了 解决 那个 12 张 表 连 接 的 大 型 查询 的 优化 方案 了 , 由 于 这 个 SQL 里 使 用 了 大 量 的 占 位 操作 ， 
导致 优化 器 产生 的 执行 计划 不 合理 ， 这 个 SQL 占用 了 收费 系统 30% 以 上 的 系统 资源 。 如 果 将 这 
些 占 位 操作 全 部 去 掉 ， 那 么 这 个 SQL 的 执行 计划 将 十 分 完美 ， 所 耗资 源 不 到 目前 消耗 量 的 1%。 

为 了 防止 开发 商 以 业务 太 复 杂 、 程序 无 法 实现 为 理由 而 不 愿意 去 掉 占 位 操作 , 老 熊 还 特意 设 
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计 了 一 个 存储 过 程 。 使 用 这 个 存储 过 程 ， 通 过 输入 不 同 的 条 件 ， 可 以 拼凑 出 满足 各 种 要 求 的 、 不 
含 占 位 操作 的 SQL 语句 。 实 际 上 ， 开 发 商 只 要 根据 老 能 的 存储 过 程 经 过 小 的 调整 ， 就 可 以 完成 
SQL 拼凑 的 程序 ， 然 后 将 拼凑 出 来 的 没有 占 位 操作 的 SQL 提交 执行 ， 这 样 就 可 以 大 大 减少 这 个 
SQL 的 开销 。 

按照 预先 设计 好 的 思路 , 我 们 先 提 出 了 去 掉 占 位 操作 ， 可 以 提高 儿 十 们 的 性 能 ， 从 而 解决 掉 
收费 系统 CPU 瓶颈 的 问题 。 老 能 展 示 了 使 用 占 位 操作 和 去 掉 占 位 操作 的 SQL 的 执行 结果 和 开销 
的 比较 。 可 以 看 出 结果 是 相同 的 ， 但 是 开销 大 大 减少 了 。 

开发 商 很 愉快 地 认可 了 优化 的 效果 , 但 是 他 们 马上 提出 了 去 掉 占 位 操作 的 逻辑 十 分 复杂 , 要 
重 构 这 个 业务 模块 的 逻辑 ， 难 度 太 大 , 已 经 超出 了 他 们 目前 的 能 力 。 这 种 回答 是 我 们 预先 有 准备 
的 ， 我 马上 追问 :“ 你 们 的 难点 在 哪里 ? 哪个 问题 是 你 们 目前 无 法 解决 的 ?” ”开发 商 的 回答 是 由 
于 这 个 模块 的 业务 逻辑 十 分 复杂 ,迫不得已 才 使 用 占 位 操作 符 的 ， 如 果 去 掉 占 位 操作 ， 他 们 将 无 
法 根据 逻辑 条 件 生 成 不 带 占 位 操作 的 SQL, 除非 我 们 给 他 们 找到 一 个 解决 方案 , 否则 他 们 很 难 完 
成 这 个 修改 。 

这 个 问题 正中 我 们 的 下 怀 , 我 们 早 就 知道 开发 商 可 能 以 这 个 理由 来 拒绝 修改 。 看 到 开发 商 进 
入 了 我 们 的 圈套 ， 老 熊 搞 的 那个 存储 过 程 马上 被 投影 到 墙 上 , 通过 十 分 清晰 的 逻辑 ， 展示 了 去 掉 
占 位 操作 的 SQL 生成 方案 。 孙 主任 看 后 马上 说 :“ 这 个 很 清晰 , 连 我 这 个 不 懂 技 术 的 人 都 看 得 懂 ， 
这 么 做 应 该 是 可 行 的 吧 ? ” 

由 于 开发 商 没 有 想到 我 们 居然 会 准备 得 这 么 充分 , 这 种 情况 下 他 们 也 没 办 法 打 太 极 拳 了, 也 
只 能 承认 这 个 方案 是 可 行 的 。 于 是 我 们 马上 要 求 他 们 承诺 在 6 月 20 日 前 完成 应 用 的 修改 , 并 在 6 
H 25 日 前 发 布 补丁 包 。 在 我 们 和 甲 方 的 共同 努力 下 , 开发 商 只 得 承诺 在 6 月 25 日 前 发 布 补丁 包 。 

今天 的 例会 开 得 十 分 成 功 ， 出 来 后 ， 大 家 都 感到 放下 了 一 个 很 大 的 包容 。 中 午 吃饭 时 ， 老 于 
十 分 感慨 :“ 这 种 用 户 太 仗 义 了 ， 如 果 我 们 不 尽心 尽力 帮 他 们 解决 问题 ， 就 白 活 了 。” 孙 主任 今天 
的 宽容 大 度 让 大 家 都 有 一 种 滴水 之 恩 当 涌 泉 相 报 的 感觉 ， 小 齐 也 说 :“ 碰 到 这 种 用 户 ， 是 我 们 的 
福气 ， 我 们 绝对 不 能 辜负 他 们 。 

小 齐 下 午 就 要 回 北 京 , 所 以 我 也 希望 她 回 北京 后 能 够 和 集团 公司 沟通 , 把 今天 开发 商 承 诺 修 
改 那 个 应 用 的 结果 巩固 下 来 。 这 个 SQL 如 果 能 够 修改 ， 那 么 收费 系统 的 优化 问题 基本 上 就 解决 
了 。 虽 然 会 上 大 家 都 达成 了 一 致 ， 不 过 我 感觉 如 果 不 通过 高 层 施 压 ， 这 个 问题 没 那么 容易 解决 ， 
开发 商 的 情 性 比 我 预想 的 还 要 大 。 由 于 集团 公司 那 边 有 下 一 期 合同 作为 夸 码 , 他们 的 话 开 发 商 还 
是 能 够 充分 考虑 的 。 集 团 公司 出 面向 开发 商 的 高 层 施 压 ， 其 至 比 孙 主 任 他 们 说 话 分 量 还 要 大 。 
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如 果 在 优化 项 目 中 磁 到 了 类 似 今 天 遇 到 的 问题 ,该 怎么 办 呢 ? 这 种 情况 下 , 客户 最 不 喜欢 听 
到 的 是 推卸 责任 的 话 ， 因 此 在 汇报 时 尽 可 能 把 责任 承担 下 来 , 并 且 诚 司 地 向 客户 表态 这 种 问题 不 
会 再 发 生 , 希望 客户 给 我 们 更 多 的 机 会 。 如 果 这 个 时 候 去 强调 客观 原因 ， 那 是 会 适得其反 的 。 
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为 实际 上 项 目 是 客户 的 项 目 ， 客户 和 我 们 应 该 是 一 荣 俱 来 、 一 损 俱 损 的 ， 所 以 客户 和 我 们 的 目标 
实际 上 是 相同 的 。 如 果 这 个 项 目 做 砸 了 ,那么 客户 受到 的 影响 比 我 们 还 大 。 所 以 无 论 如何 ， 客户 
都 会 帮助 我 们 走出 困境 的 ， 而 这 个 时 候 如 果 你 还 去 推卸 员 任 ， 只 能 激 起 客户 的 怒火 ， 而 不 可 能 把 
你 的 责任 推卸 干净 。 勇 于 担当 也 是 DBA 在 特殊 环境 下 必须 拥有 的 性 格 。 今 天 孙 主 任 并 没有 对 我 
们 提出 很 严厉 的 批评 , 这 也 是 一 个 成 熟 的 甲 方 的 正确 选择 。 因 为 孙 主 任 是 这 个 项 目 甲 方 的 负责 人 ， 
这 个 项 目的 成 败 对 他 的 影响 是 最 大 的 ,而 孙 主 任 最 终 依 赖 的 力量 就 是 我 们 这 批 干洗 的 人 , 所 以 他 
不 把 在 公司 领导 那 边 承受 的 压力 转嫁 到 项 目 实施 小 组 身上 是 十 分 明智 的 。 


SREI) STATSPACK 报告 在 优化 项 目 中 的 作用 


在 本 书 中 ， 很 多 地 方 提 到 STATSPACK ， 那 么 STATSPACK 到 底 是 一 个 什么 东西 ， 它 如 何在 
数据 库 优化 中 发 挥 作 用 呢 ? 说 到 STATSPACK, ， 就 不 能 不 说 说 OWI (Oracle Wait Interface), OWI 
是 Oracle 的 数据 库 性 能 分 析 接 口 ， 提 供 了 一 系列 的 视图 。 通 过 对 这 些 视图 的 访问 ， 就 可 以 了 解 
Oracle 性 能 状态 。 这 些 视图 包括 以 下 几 种 。 

O v$system event; 总 体 性 视图 。 
D v$session event; 按照 会 话 划分 的 总 体 性 视图 。 

O v$session wait; 明细 信息 ， 每 三 秒 钟 刷新 一 次 等 待 时 间 。 

STATSPACK 作为 性 能 分 析 工 具 是 基于 OWI 的 , 它 通 过 采样 获得 当前 系统 状态 的 快照 。 通 过 
两 个 采样 点 ， 就 可 以 生成 出 一 份 STATSPACK 报告 ， 其 中 包含 了 这 两 个 快照 点 之 间 的 系统 的 性 能 
状态 。 通 过 解读 这 份 报告 ， 可 以 很 详细 地 了 解 系统 的 性 能 状态 ， 从 而 找到 系统 存在 的 问题 。 

很 多 DBA 试图 通过 各 种 价格 昂贵 的 工具 来 定位 数据 库 性 能 问题 ， 甚 实 他 身边 就 拥有 
STATSPACK 这 个 功能 强大 并 且 免 费 的 系统 性 能 工具 。 我 曾经 阅读 过 大 量 DBA 发 来 的 
STATSPACK 报告 ， 并 且 在 解读 报告 后 和 他 们 探讨 数据 库存 在 的 性 能 问题 。 总 是 有 人 问 我 ， 你 是 
怎么 看 出 来 的 ? 这 是 一 个 十 分 复杂 的 问题 ， 解 读 STATSPACK 报告 需要 对 STATSPACK 报告 的 各 
种 系统 性 能 指标 有 比较 深入 的 了 解 , 也 需要 丰富 的 数据 库 管 理 经 验 , 最 重要 的 是 需要 有 很 大 的 耐 
心 ， 能 够 把 厚 厚 的 STATSPACK 报告 像 看 王朔 的 小 说 一 样 津 津 有 味 地 读 完 , 需要 有 十 分 专业 的 知 
识 和 认真 的 态度 。 

对 于 DBA 来 说 ， 随 着 Oracle 新 版 本 的 推出 ，STATSPACK fh Ft RMA Dix 了， 这 对 DBA 
来 说 是 一 个 福音 。 越 来 越 多 的 指导 性 数据 出 现在 报告 里 ,使 DBA 不 再 像 对 早期 的 STATSPACK 
报告 或 者 BSTAT/ESTAT 报告 一 样 一 筹 莫 展 。 解 读 Oracle 9i 的 STATSPACK 报告 是 十 分 有 趣 的 ， 
特别 是 对 于 Oracle 9i 新 增 的 几 个 缓冲 区 设置 指导 图 表 。Oracle 10g 提供 了 更 简单 易 用 的 AWR, 
AWR 是 和 STATSPACK 类 似 的 工具 ,基本 上 可 以 看 做 是 STATSPACK 的 升级 版 本 ,虽然 Oracle 10g 
中 依然 保留 了 STATSPACK 这 个 工具 , 不 过 很 少 人 舍弃 AWR 继续 使 用 STATSPACK, “Oracle 10g 
是 一 个 易于 管理 的 数据 库 ”，Oracle 公司 经 常 这 样 为 这 个 全 新 的 数据 库 宣 传 。 单 从 AWR、ASH 和 
ADDM 来 看 ， 我 觉得 这 个 宣传 是 完全 可 信 的 。 
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目前 有 很 多 对 STATSPACK 信息 进行 分 析 的 工具 软件 ， 有 免费 的 也 有 收费 的 (当然 价格 十 分 
昂贵 ) 。 作 为 专业 人 士 使 用 的 信息 来 说 ， 这 些 工具 能 够 达到 的 数据 分 析 能 力 十 分 有 限 ， 远 远 没 有 
STATSPACK 报告 本 身 所 传达 的 信息 丰富 。Oracle 公司 有 一 个 解读 和 分 析 STATSPACK 报告 的 工 
R, RERA STATSPACK 报告 ， 就 能 够 输出 一 份 该 报告 的 解读 结果 。 这 是 我 目前 见 到 的 最 好 的 
STATSPACK 报告 分 析 工 具 ， 但 是 这 份 报告 传递 出 的 信息 还 是 设法 和 原始 报告 相 比 的 。 

在 今后 几 个 章节 的 “优化 小 技巧 ”中 ,我 将 会 和 大 家 一 起 讨论 STATSPACK 报告 ， 目 的 是 通 
过 实例 来 阐述 如 何 解读 STATSPACK 报告 。 我 将 通过 解读 STATSPACK 报告 ， 系 统 地 介绍 Oracle 
数据 库 性 能 优化 。 因 为 我 认为 ，Oracle 数据 库 的 优化 工作 ， 本 来 就 是 应 该 围绕 着 STATSPACK 报 
告 进 行 的 。 

对 于 Oracle 10g 或 者 更 新 的 数据 库 , 除了 STATSPACK 以 外 , DBA 还 可 以 使 用 AWR 和 ASH 
报告 来 对 数据 库 进 行 分 析 。AWR 报告 的 内 容 和 STATSPACK 报告 类 似 。 


E^ ffif£ljáI8) STATSPACK 报告 头 的 解读 


STATSPACK 报告 的 第 一 部 分 是 报告 头 ， 其 中 包含 数据 库 实例 的 信息 以 及 报告 采集 的 时 间 等 
信息 


Ho 








STATSPACK report for 


DB Name DB Id Instance Inst Num Release Cluster Host 
TEST 3209088040 test —— 19.2.0.4.0 NO — hmx-01 —— 
Snap Id Snap Time Sessions Curs/Sess Comment 
Beide ^ o OS!” 2 12-Jul-04 12:03:05 319 184.1 
End Snap: 11 12-Jul-04 14:07:49 314 188.5 
Elapsed: 124.73 (mins) 


Buffer Cache: 4,000M Std Block Size:8K 
Shared Pool Size: 304M Log Buffer:1,024K 


DB Name; 报告 的 数据 库 的 名 称 。 

DB Id: 报告 的 数据 库 的 ID ， 是 一 个 唯一 性 的 编码 。 
Instance: 数据 库 实 例 的 名 字 。 

Inst Num; 实例 的 编号 。 如 果 不 是 RAC 系统 ， 一 般 是 1, 
Release: 数据 库 的 版 本 。 

Cluster; 是 否 是 OPS/RAC 环境 。 

Host: 报告 的 数据 库 主机 的 名 称 。 
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Snap Id; STATSPACK 状态 快照 (Snap) 的 编码 。 

Snap Time: STATSPACK 状态 快照 的 时 间 。 

Sessions; 状态 快照 当时 的 数据 库 会 话 数量 。 

Curs/Sess: 每 个 会 话 打 开 的 游标 数量 。 

Cache Sizes: 在 终止 快照 时 各 种 缓冲 区 的 状态 。 

Buffer Cache: 各 种 数据 块 缓冲 区 的 大 小 ， 上 面 的 例子 是 4 000MB。 

Std Block Size/Block Size: 默认 块 大 小 ， 也 就 是 8i 的 块 大 小 (block size), 
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今天 早上 起 来 发 现 系统 运行 很 正常 ，CPU 较为 紧张 的 收费 系统 的 R 队 列 一 般 都 在 20 以 内 ， 
CPU 使 用 率 基 本 上 在 80% 多 ，WIO 也 在 10% 一 20% 之 间 。 从 平均 事务 响应 时 间 来 看 ， 今 天 上 午 
的 平均 事务 响应 时 间 比 优化 实施 前 提高 了 大 约 40%, 

我 走 到 小 孙 的 电脑 边 ， 问 小 孙 最 近 BBS 上 反馈 怎么 样 。 小 孙 打 开 BBS， 发 现 这 几 天 BBS E 
冷清 了 不 少 ， 甚 至 有 些 人 在 夸 系 统 最 近 有 所 改善 ， 希 望 我 们 再 接 再 厉 。 

10 点 多 有 一 个 营业 厅 打 电话 投诉 说 系统 速度 很 慢 ， 没 法 工作 了 。 当 时 把 大 家 都 吓 了 一 跳 ， 
老 于 急忙 跑 到 OMS 服务 器 上 去 看 实时 监控 的 信息 ， 这 几 天 我 们 一 上 班 就 把 几 个 主要 的 OEM 
RIAT, 并且 开启 了 录像 。 一 旦 有 人 投诉 性 能 问题 ， 我 们 立即 就 可 以 通过 回放 来 观察 系统 ， 找 
到 问题 的 原因 。 老 于 看 了 半天 ， 没 发 现 有 任何 异常 ， 系 统 的 各 项 指标 都 很 正常 。 

再 次 打 电 话 回 营业 厅 确 认 , 那 边 的 反馈 是 现在 系统 的 速度 有 所 改善 , 但 是 那个 营业 员 还 是 感 
觉 系 统 很 慢 。 我 让 小 孙 回 问 他 们 和 营业 厅 其 他 的 终端 是 不 是 都 很 慢 , 那 边 的 回答 是 只 有 她 这 个 终端 
最 ， 其 他 终端 都 很 正常 。 听 到 这 个 消息 ， 大 家 都 松 了 一 口气 ， 马 上 把 这 个 服务 请 求 转 到 做 桌面 服 
务 的 公司 去 了 ， 佑 计 又 是 病毒 之 类 的 东西 搞 的 。 

虚惊 一 场 后 , 我 们 儿 个 一 起 坐 在 吸烟 区 喝 茶 。 今 天 我 嗓子 不 太 好 ， 所 以 没有 接 老 于 递 过 来 的 
烟 ， 只 有 老 于 一 个 人 在 那里 吞 云 吐 雾 。 第 一 次 调整 结束 了 ， 有 经 验 也 有 教训 ， 不 过 我 们 没有 时 间 
来 总 结 这 些 。 开 发 商 的 态度 一 直 是 我 们 担心 的 问题 ， 这 可 能 成 为 本 项 目 成 败 的 关键 。 我 们 实施 优 
化 前 曾经 考虑 过 的 那个 问题 真 的 成 了 现实 ， 开 发 商 下 一 步 可 能 会 放 慢 SQL 优化 的 进度 。 如 何 能 
给 开发 商 更 大 的 压力 ， 使 他 们 能 够 在 6 月 20 日 之 前 完成 所 有 的 应 用 优化 工作 ， 使 项 目 能 够 按时 
验收 呢 ? 大 家 想 了 半天 也 没有 提出 什么 好 的 建议 ， 三 个 郁闷 的 人 只 好 先 去 吃 了 午饭 。 

下 午 甲 方 的 张 工 他 们 过 来 了 ,主要 是 和 我 们 讨论 下 一 步 优化 的 方案 。 张 工 今天 比较 兴奋 ， 从 
昨天 和 今天 上 午 系统 的 情况 看 ， 系 统 性 能 改善 十 分 明显 ，BBS 上 其 至 出 现 了 很 多 正面 的 消息 , 很 
多 人 都 在 感谢 开 部 门 做 了 件 好 事 ， 和 希望 系统 能 够 持续 好 下 去 。 上 午 张 工 甚 至 在 BBS EE TILA 
帖子 ， 对 大 家 的 支持 表示 感谢 ， 并 且 表 示 优 化 还 会 继续 下 去 ， 系 统 会 越 来 越 好 。 

老 能 下 午 去 了 开发 商 那 边 ， 给 他 们 进一步 讲解 那个 SQL 去 掉 占 位 符 后 的 处 理 方法 。 我 和 老 
于 陪 着 张 工 他们 两 个 在 楼 梯 口 的 吸烟 区 聊 了 好 入 。 我 提出 目前 最 担心 的 是 系统 好 转 会 让 集成 商 觉 
得 目的 达到 了 ， 因 此 放松 了 SQL 修改 。 如 果 开 发 商 不 完成 我 们 提交 的 几 十 个 SQL 的 修改 ， 那 么 
这 个 优化 项 目 功 亏 一 策 ， 虽 然 日 前 系统 性 能 可 以 有 所 提升 ， 不 过 这 种 好 转 无 法 持续 较 长 的 时 间 。 
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目前 我 们 的 优化 虽然 有 点 成 果 , 不 过 随 着 系统 数据 量 的 增长 以 及 新 业务 模块 的 上 线 , 我 们 获得 的 
优化 成 果 很 快 就 会 被 抵消 ， 出 不 了 半年 ， 问 题 就 会 再 现 。 本 来 这 个 问题 是 应 该 在 昨天 的 例会 上 谈 
AY, (Hee Mabel fe Ha AAA AR me, AA i. 

张 工 一 直 对 开发 商 的 态度 感到 不 满 ， 听 说 后 感觉 问题 十 分 严重 ,立即 和 孙 主 任 联系 ， 把 我们 
的 担心 告诉 了 孙 主 任 。 孙 主任 让 我 接 电话 ， 问 我 为 什么 昨天 会 上 不 说 这 个 问题 。 我 说 会 上 讨论 这 
个 问题 不 会 有 什么 结果 ， 最 后 可 能 会 形成 扯皮 。 现 在 已 经 6 月 12 日 了 ， 我 们 预期 是 6 月 15 H 
成 商 完成 SQL 的 修改 ， 并 且 于 6 H 20 日 前 上 线 ， 最 迟 也 不 能 晚 于 6 H 25 日 上 线 ， 因 为 25 日 后 
将 是 账 期 处 理 , 再 上 线 新 补丁 风险 很 大 。 而 从 目前 来 看 ,集成 商 还 是 不 表 对 这 两 个 时 间 点 进行 确 
认 。 

孙 主 任 问 我 这 个 问题 如 何 解 决 , 我 说 如 果 现在 性 能 不 那么 好 ,就 可 以 压 开发 商 了 ,如 果 前 几 
天 我 们 不 做 优化 就 好 了 。 孙 主任 说 可 惜 优化 已 经 做 了 ， 总 不 能 退回 去 吧 。 我 说 :“ 如 有 果 由 于 某 个 
新 开通 的 模块 导致 系统 负载 增加 ， 系 统 性 能 又 变 坏 了， 那么 就 要 轮 到 开发 商 着 急 了 。” 孙 主任 心 
领 神 会 ， 说 :“ 小 白 ， 你 小 子 够 可 以 的 ， 这 种 招 都 想 得 出 。 那 怎么 让 现在 系统 的 性 能 变 差 ? ”我 
说 :“ 前 阵子 不 是 有 些 模块 由 于 性 能 问题 上 线 后 又 被 迫 下 线 了 吗 ? 如 果 现 在 这 些 模块 必须 马上 上 
线 ， 那 么 系统 压力 估计 又 很 快要 冲 到 100% 了 。” 

孙 主 任 会 心地 笑 笑 说 :“ 小 白 ， 这 方面 你 是 我 老师 ， 我 真 要 好 好 和 你 学 学 。” 

我 说 :“ 老 人 家 说 过 ， 与 人 斗 其 乐 无 穷 。 我 这 也 是 被 融 出 来 的 ， 做 优化 的 ， 这 种 问题 是 经 党 
磁 到 的 ， 不 无 耻 一 点 就 没 法 生存 了 。 

最 后 大 家 决定 由 孙 主 任 负责 发 个 通知 ,就 说 由 于 优化 取得 了 一 定 的 效果 ， 上 个 月 停 用 的 几 个 
模块 可 以 恢复 运行 ， 各 营业 厅 在 6 月 13 日 可 以 恢复 使 用 这 几 个 模块 。 因 为 有 1 个 月 没有 开放 这 
几 个 模块 了 , 而 且 月 底 又 是 半年 绩效 考核 的 时 间 , 一 旦 这 几 个 统计 模块 一 开放 ,估计 会 有 大 量 的 
营业 员 使 用 这 个 模块 来 对 自己 的 业绩 进行 统计 分 析 。 这 可 能 对 系统 形成 较 大 的 压力 ,其 至 使 系统 
的 性 能 比 优 化 前 还 糟糕 。 不 过 随 之 而 来 ， 孙 主任 肯定 会 承受 一 定 的 压力 。 如 果 能 顶 住 这 儿 天 的 压 
力 ， 开 发 商 肯 定 会 坐 不 住 的， 业务 部 门 甚至 会 把 问题 捅 到 集团 公司 去 。 

放下 电话 ， 大 家 都 感到 有 点 好 笑 ， 采 用 这 样 的 方法 来 压 开发 商 修改 程序 ， 真 是 第 一 次 磁 到 。 
正在 这 时 ， 孙 主任 的 电话 又 打 进 来 了 ， 他 问 我 :“ 你 是 否 确认 以 集成 商 的 能 力 ， 这 些 SQL 是 能 够 
在 6 月 15 日 乙 前 修改 完毕 的 ， 会 不 会 修改 的 工作 量 太 大 了 ? ”我 告诉 他 ， 我 们 都 已 经 把 优化 方 
案 写 得 很 清楚 了 ， 如 果真 心 要 修改 ， 顶 多 三 五 天 时 间 ， 就 可 以 全 部 改 完 测试 完 。 孙 主任 说 ， 如 果 
这 样 ， 我 就 去 操作 了 ， 大 家 一 定 要 给 集成 商 足够 的 压力 。 

看 样子 下 面 头 痛 的 应 该 是 集成 商 了 。 明 天 的 BBS 上 应 该 又 是 骂 声 一 片 了 。 今 天 和 孙 主 任 的 
交流 十 分 到 位 ， 通 完 电 话 我 自己 都 觉得 自己 很 了 不 起 。 正 沉浸 在 兴奋 之 中 ,我 的 手机 响 了 ， 是 一 
个 很 陌生 的 电话 ， 沈 阳 本 地 的 。 

原来 电话 是 HP 维修 站 打 来 的 ,说 我 的 电脑 换 了 主板 还 是 无 法 启动 ,看 样子 是 CPU 出 问题 了 ， 
CPU 目前 沈阳 没有 货 ， 必须 从 北京 调 货 ， 可 能 要 一 周 左 右 的 时 间 才 能 修好 。 再 有 一 周 时 间 ， 估计 
我 都 已 经 回 深圳 了 ， 所 以 我 决定 不 修了 ,干脆 带 回 深圳 再 说 吧 。 
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打车 去 三 好 街 取 回电 脑 , 我 把 以 前 拆 下 来 的 硬盘 重新 装 好 , 顺便 按 了 一 下 电源 开关 ， 电源 灯 
居然 亮 了 ,随后 电脑 就 启动 起 来 了 。 我 真是 服 了 维修 站 的 这 帮 人 了 ， 又 是 换 主板 又 是 换 CPU 的 ， 
原来 电脑 根本 就 没有 坏 。 


X spam 


本 书写 到 这 里 ， 基 本 上 也 算是 到 高 潮 了 。 今 天 的 主题 是 阴谋 ， 实 际 上 可 以 算是 阳 谋 ， 因 为 其 
目的 是 好 的 。 干 脆 今 天 给 大 家 分 享 一 下 我 做 性 能 优化 的 一 些 粗浅 的 体会 吧 。 

算 起 来 ， 从 第 一 次 给 客户 优化 系统 到 现在 也 有 10 多 年 了 。 在 这 些 年 里 ， 接 触 过 不 同 的 客户 、 
不 同 的 系统 ， 对 于 优化 的 体会 也 越 来 越 深刻 。 刚 开始 做 优化 时 ， 总 是 希望 找 出 系统 中 所 有 存在 问 
题 的 地 方 , 然后 一 个 一 个 地 进行 调整 。 由 于 对 Oracle 基本 原理 的 认识 不 够 , 并且 对 优化 的 认识 
仅 限于 调整 不 合理 的 部 分 这 种 浅 层 次 上 ， 所 以 往往 做 出 一 些 事与愿违 的 事情 来 。 对 于 系统 优化 ， 
今天 总 结 一 下 最 有 感触 的 儿 点 和 大 家 共享 。 

(1) 优化 是 基于 目标 的 ， 我 们 的 最 终 目的 是 达到 一 个 目标 ， 而 不 是 优化 本 身 。 目 标的 合理 性 
决定 了 优化 项 目的 成 败 。 刚 刚 开 始 给 用 户 优化 时 , 我 会 把 所 有 能 够 调整 的 东西 一 次 性 全 部 调整 完 
毕 。 哪 怕 有 些 调整 给 系统 性 能 带 来 的 好 处 不 到 0.1%。 对 于 生产 系统 ， 不 确定 因素 十 分 多 ， 而 很 
多 参数 方面 的 调整 本 身 就 是 双 刃 剑 , 如 果 你 无 法 预期 其 调整 的 影响 , 那么 这 种 调整 是 存在 风险 的 ， 
在 实施 时 就 应 该 慎重 考虑 。 现 在 我 做 优化 的 项 目 ， 往 往 会 根据 用 户 的 优化 目标 ， 然 后 在 此 基础 上 
进行 分 析 ， 制 订 方案 ， 实 施 的 结果 虽然 一 般 会 超出 客户 的 期 望 ， 但 是 我 不 会 在 生产 系统 上 做 一 些 
没 把 握 的 事情 。 锦 上 添 花 的 事情 有 时 候 也 要 考虑 是 否 值 得 ， 因 为 弄 不 好 ,锦上添花 会 变 成 画 蛇 添 
足 。 

(2) 1+1 不 一 定 大 于 1。 在 优化 过 程 中 ， 抓 住 主要 了 矛盾， 解决 主要 问题 ， 而 不 要 胡子 眉毛 一 把 
抓 。 很 多 调整 之 间 有 关联 性 ， 甚 至 是 互 斥 的 ， 不 合理 的 调整 可 能 带 来 更 坏 的 结果 。 

(3) 客户 需要 的 是 系统 的 优化 ， 而 不 仅仅 是 数据 库 的 优化 。 在 客户 的 目标 里 ， 看 到 的 是 一 个 
系统 ， 而 不 是 一 个 白 立 的 数据 库 。 在 10 年 前 ,我 可 能 会 说 ， 操 作 系 统 的 问题 你 们 还 是 找 一 下 三 
家 。 而 现在 ， 我 会 对 客户 说 ， 你 放心 ， 我 们 做 的 是 系统 优化 。 

(4) 用 适当 的 方式 和 应 用 开发 厂商 配合 。 很 多 优化 项 目 由 于 无 法 和 应 用 厂商 有 效 的 配合 ， 其 
效果 大 打折 扣 。 因 为 应 用 是 和 系统 性 能 关系 最 为 紧密 的 。 如 果 应 用 开发 厂商 不 能 很 好 地 配合 ,， 那 
么 优化 项 目 将 举步维艰 。 如 果 你 和 开发 厂商 说 “你 这 个 SQL 开销 太 大 ， 需 要 修改 一 下 ， 那 么 得 
































第 二 是 ……”， 这 样 你 很 可 能 会 得 到 比较 好 的 结果 。 你 是 优化 专家 ， 找 出 几 个 Top SQL 这 样 的 工 
作 不 需要 专家 来 完成 ， 而 专家 的 职责 不 仅仅 是 发 现 Top SQL， 而 是 如 何 解决 掉 Top SQL, 

(5) 不 要 相信 什么 优化 规则 ， 实 际 上 并 没有 条 条 框框 限制 你 ， 实 现 目 标的 任何 方法 你 都 可 以 
使 用 。 对 于 一 个 初级 DBA Rii, B DBA 可 能 会 告诉 你 什么 是 对 的 , 什么 是 不 对 的 。 而 对 错 都 是 
相对 的 ， 如 果 你 已 经 深刻 地 理解 了 Oracle 以 及 系统 优化 ， 那 么 就 像 金 庸 小 说 里 的 内 功 高 手 一 样 ， 
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无 招 胜 有 招 。 


Z ikiua) 分 析 STATSPACK 的 负载 数据 
Load Profile 对 于 我 们 了 解 系统 的 负载 情况 帮助 很 天。 经 常 有 人 问 我 : “STATSPACK 报告 中 
的 某 个 指标 是 xxx， 是 不 是 太 高 了 ? ”实际 上 ， 革 个 指标 是 高 是 低 必 须 依 赖 于 系统 的 负载 情况 ， 
因此 了 解 系统 的 总 体 负 载 情况 十 分 关键 。 下 面 是 一 个 例子 


Load Profile 











em re re me Per Second Per Transaction 

Redo size: 102,614.22 5,270.76 

Logical reads: 86,915.82 4,464.41 

Block changes: 621.01 31.90 

Physical reads: 1767:73 90.80 

Physical writes: 141.67 7.28 

User calls: 1,979.58 101.68 

Parses: 293.79 15.09 

Hard parses: 7.43 0.38 

Sorts: 23.28 1.20 

Logons: 0.20 0.01 

Executes: 461.41 23.70 

Transactions: 19.47 

$ Blocks changed per Read: 0.73. Recursive Call $: 26.70 
Rollback per transaction $: 1.35 Rows per Sort: 1012.48 


Load Profile 标志 当前 系统 的 负载 情况 。 对 于 同一 套数 据 库 系统 ， 如 果 应 用 没有 大 的 改动 ， 
那么 Load Profile 的 变化 基本 上 可 以 反映 出 系统 总 体 负载 情况 的 变化 。Load Profile 中 的 Per 
Second 是 每 秒 钟 的 数据 ，Per Transaction 是 每 个 事务 的 数据 。 每 秒 钟 的 数据 反映 系统 的 总 体 
负载 ， 每 个 事务 的 数据 反映 应 用 相关 的 数据 。 

O Redo size: 系统 产生 重 做 记录 的 字 节 数 。 通 过 Redo size， 我 们 大 体 上 可 以 看 出 系统 
的 负载 情况 。 一 般 来 说 ， 这 个 值 越 大 系统 的 负载 也 相对 越 大 。 

O Logical reads: 系统 产生 的 逻辑 读 的 块 数 。 逻 辑 读 的 大 小 可 以 看 出 数据 库 消耗 的 系统 
资源 ， 特 别 是 CPU 资源 的 情况 。 逻 辑 读 越 大 的 系统 消耗 CPU 也 越 高 。 

O Block changes; 块 变化 的 数量 。 块 变化 不 一 定 是 逻辑 读 , 一 些 事务 操作 也 会 产生 块 变 化 。 
Physical reads; 物理 读 的 数量 。 物 理 读 的 值 越 高 ， 说 明 系 统 对 于 VO 的 负载 越 大 。 如 
果 某 个 系统 的 物理 读 突然 变 高 ， 就 要 查 查 是 不 是 某 个 应 用 走 了 全 表 扫 描 了 。 

Physical writes; 物理 写 的 数量 。 

User calls: 用 户 调用 的 数量 。 

Parses: SQL 分 析 的 数量 。 

Hard parses: 硬 分 析 的 数量 。 

Sorts: 排序 的 数量 。 
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D OD oO O 


6H12H 阴 ps 233 








Ooo oO O 





a 


Logons: 登录 的 数量 。 

Executes: SQL 执行 的 数量 。 

Transactions: 系统 中 每 秒 钟 事务 的 数量 。 

$ Blocks changed per Read: 每 次 读 取 数 据 块 后 被 修改 的 百分比 。 

Recursive Call %: 为 了 执行 SQL, 系统 额外 需要 的 SQL 称 为 递归 调用 (Recursive Call). 
这 类 调用 的 比例 越 低 越 好 。 


口 Rollback per transaction $; 回 退 事务 的 百分比 。 





Rows per Sort: 每 次 排序 的 记录 数 。 本 例 中 每 次 排序 的 记录 数 比较 多 。 


时 ' 仿 优化 小 技 15) 重要 的 命中 率 指标 


虽然 说 命中 率 指标 不 能 作为 性 能 分 析 的 主要 依据 , 不 过 其 参考 价值 仍然 是 十 分 大 的 。 特别 是 
对 于 某 类 系统 比如 OLTP 系统 )， 命 中 率 指标 还 是 有 一 定 规 律 的 。 对 于 相同 的 一 套 系统 ， 在 较 
长 的 时 期 内 ， 其 命中 率 指标 基本 上 会 稳定 在 一 个 基线 上 ， 如 果 超 出 了 基线 的 范围 ,那么 肯定 系统 
出 现 了 某 种 不 确定 的 变化 。 下 面 通过 一 个 实例 来 说 明 各 个 指标 : 


Instance Efficiency Percentages (Target 100%) 

















Buffer Nowait $: 99.89 Redo NoWait $: 100.00 

Buffer Hit $: 98.02 In-memory Sort %: 99.95 

Library Hit $: 99.23 Soft Parse $: 97.47 

Execute to Parse $: 36.33 Latch Hit $: 99.90 

Parse CPU to Parse Elapsd $: 10.38 $ Non-Parse CPU: 95,72 

Shared Pool Statistics Begin End 

Memory Usage $: 80.10 79.53 
$ SQL with executions>1: 87.35 90.32 
$ Memory for SQL w/exec»1: 99.04 99.27 


下 面 列 出 了 一 些 重要 的 数据 库 命 中 率 指标 。 
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Buffer Nowait: 数据 库 缓冲 区 访问 无 等 待 的 比例 ， 目 标 100%, 

Buffer Hit: 数据 库 缓冲 的 命中 率 ， 目 标 100%, 

Library Hit: 库 缓 冲 的 命中 率 ， 目 标 100%, 

Execute to Parse; (l-Parse/Execute) %， 目 标 100%, 

Parse CPU to Parse Elapsd: 分 析 使 用 的 CPU 与 分 析 消 耗 的 总 时 间 的 比值 , 目标 100%, 
如 果 这 个 值 比较 低 ， 说 明 在 分 析 过 程 中 不 仅仅 消耗 了 CPU 资源 ， 还 有 很 多 等 待 事件 ， 比 
如 等 待 共享 池 对 象 、 门 锁 等 。 

Redo NoWait: Redo 写 无 等 待 的 比例 ， 目 标 100%。 

In-memory Sort; 内 存 排序 的 比例 ， 目 标 100%, 

Soft Parse: 软 分 析 的 比例 ， 目 标 100% 。 

Latch Hit: 门 锁 命中 率 ， 目标 100% 。 
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$ Non-Parse CPU: 除去 分 析 以 外 的 CPU 的 使 用 率 ， 目 标 100%。 从 这 个 指标 可 以 了 解 
分 析 消 耗 了 多 少 CPU 资源 。 

Shared Pool Statistics; 共享 池 使 用 情况 。 

Memory Usage%: 共享 池 使 用 百分比 。 如 果 太 低 ， 说 明 共 享 池 可 能 不 足 。 不 过 这 个 值 不 
是 绝对 的 ， 对 于 不 同 的 系统 其 表现 不 同 。 这 个 值 接近 100% 并 不 一 定 就 说 明 共 享 池 已 经 不 
足 ， 需 要 扩充 了 。 

$ SQL with executions>1: 执行 次 数 大 于 1 的 SQL。 该 值 越 高 说 明 SQL 的 重用 率 越 
% Memory for SQL w/exec»1: 执行 次 数 大 于 1 的 SQL 占用 的 内 存 占 所 有 SQL 的 比例 。 





今天 沈阳 这 边 只 剩 下 我 和 老 于 两 个 人 了 , 前 两 天 老 肖 就 因为 浙江 的 事情 离开 了 , 今天 上 午 老 
能 也 回 深 圳 去 了 。 小 齐 昨天 开 完 会 就 急 急忙 忙 地 赶 到 深圳 去 了 。 旭日 印刷 厂 那 边 急 着 要 我 们 尽快 
进 场 ， 小 齐 和 老 能 估计 又 要 在 那里 折腾 半天 。 如 果 旭 日 那 边 吃紧 ,， 老 能 这 回 走 了 之 后 也 可 能 不 会 
再 回 沈阳 了 。 在 老 能 走 之 前 ， 我 们 两 个 已 经 把 所 有 的 SQL 优化 方案 搞 好 了 ， 并 且 提交 给 了 老 于 。 
项 目 做 到 这 个 阶段 ， 基 本 上 我 们 该 做 的 事情 都 已 经 做 完了 ， 剩 下 的 就 完全 依靠 开发 商 的 支持 了 。 
不 知道 昨天 和 孙 主 任 安排 的 这 一 出 兰 肉 计 是 不 是 能 起 到 作用 。 

按照 昨天 的 布置 ， 我 和 老 于 今天 早上 出 门 晚 了 一 点 ， 到 办 公 室 时 已 经 快 10 : 00 了 。 一 到 办 
SE, 我 们 就 发 现 小 孙 正 在 焦头烂额 地 接 电话 ,估计 昨天 孙 主 任 的 招 下 得 够 狠 的 。 小 孙 是 集成 商 
常 驻 客户 这 边 的 技术 人 员 ， 主 要 负责 解决 现场 的 问题 。6 日 优化 实施 后 ， 电 话 投诉 的 量 大 幅度 下 
降 ， 小 孙 的 压力 减轻 了 不 少 , 用 他 自己 的 话说 是 度 过 了 在 沈阳 最 美好 的 一 段 时 光 。 今 天 估计 小 孙 
又 要 重 温 以 前 不 堪 的 日 子 了 。 

我 装 作 什么 都 没 看 见 ， 打 开 电 脑 ， 拿 出 茶杯 装 好 茶叶 ， 拿 着 茶杯 跑 到 OMS 服务 器 上 ， 打 开 
OEM 的 性 能 分 析 工 具 。 随 后 就 到 旁边 的 开水 房 泡 了 一 大 杯 水 。 

回 到 办 公 室 , 放下 水 杯 , 我 的 笔记 本 电脑 还 在 启动 。 这 破 本 子 是 该 换 了 , 还 是 个 赛 扬 的 1.6GB 
的 本 子 。 虽 然 装 了 2GB 内 存 ， 还 是 够 慢 的 。 和 往常 一 样 ， 在 电脑 启动 的 过 程 中 ,我 跑 到 OMS 服 
务 器 上 看 了 一 上 腿 。 一 望 过 去 ,是 一 片 惨不忍睹 的 指标 ,平均 事务 响应 时 间 高 达 3 秒 多 ， 比 昨天 慢 
了 足 足 一 倍 多 。 从 OEM 的 健康 性 检查 图 表 上 看 ， 系 统 存在 大 量 的 db file sequential read 和 db file 
scattered read 等 待 ，CPU 的 曲线 基本 上 是 一 条 贴近 100% 的 直线 。 

这 几 个 统计 查询 模块 是 营业 员 查 看 和 统计 自己 的 业绩 的 , 作为 绩效 工资 发 放 依据 的 绩效 考核 
间 标 都 必须 通过 这 几 个 模块 来 查询 。 由 于 绩效 指标 十 分 多 ,所 以 需要 做 很 多 大 型 的 查询 才能 算出 
一 个 营业 员 在 某 个 时 间 段 内 的 绩效 。 对 于 这 几 个 模块 ， 当 时 我 提出 过 优化 建议 ,一 是 对 营业 员 的 
绩效 统计 ， 能 否 先 形成 日 统计 数据 ， 这 样 跨 时 段 统计 数据 就 可 以 在 日 统计 基础 上 二 次 汇总 获得 。 
这 个 方案 由 于 程序 改动 过 大 ， 被 开发 商 否 决 了 。 后 来 老 能 也 提出 过 ， 如 果 不 能 进行 日 统计 汇总 ， 
那么 是 否 能 够 限制 一 下 统计 的 时 间 范 围 。 因 为 现在 在 统计 时 间 区 间 上 没有 任何 限制 , 很 多 营业 员 
会 选择 半年 甚至 一 年 的 时 间 范 围 来 统计 ， 甚 至 有 些 人 选择 几 年 的 数据 进行 统计 。 这 种 情况 下 ,很 
多 查询 都 会 对 很 大 的 生产 日 志 表 进行 全 表 扫 描 , 预先 设计 好 的 索引 根本 无 法 发 挥 作用 。 如 有 果 能 够 
限定 查询 时 间 跨 度 不 能 超过 1 个 月 , 那么 绝 大 多 数 查 询 都 可 以 使 用 索引 了 。 营业 员 完 全 可 以 通过 
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多 次 查询 获得 自己 的 绩效 数据 ， 然 后 自己 手工 去 进行 季度 、 半 年 和 年 度 汇总 。 这 种 优化 措施 我 们 
以 前 在 好 多 系统 中 采用 过 ,效果 还 不 错 。 不 过 老 能 提出 的 这 个 优化 建议 还 是 被 开发 商 拒绝 了 ,， 范 
总 说 如 果 是 这 样 ， 营 业 员 可 能 会 有 意见 。 

由 于 系统 资源 紧张 , 这 几 个 使 用 率 极 高 的 模块 已 经 停 用 一 个 多 月 了 , 营业 员 发 了 绩效 工资 都 
无 法 到 系统 中 去 确认 。 按 照 我 们 和 孙 主 任 约定 好 的 ， 这儿 个 模块 昨天 晚上 打开 了 , 并且 今 天 一 早 
孙 主 任 以 信息 中 心 名 义 发 了 一 个 模块 正式 重新 启用 的 通知 ， 一 大 早 就 通过 电子 邮件 、OA 系统 、 
BBS、 系 统 启动 提醒 等 多 种 形式 传达 出 去 了 。 收 到 通知 的 全 省 上 千 名 营业 员 肯 定 会 大 量 查询 ， 系 
统 不 出 问题 才 怪 。 

看 到 这 一 切 ， 我 吃惊 地 大 叫 :“ 怎 么 今天 系统 又 这 么 差 了 ,出 什么 事 了 ? ”小 孙 正 在 接 电话 ， 
他 马上 把 话 简 播 住 ， 说 :“ 是 的 ,今天 一 早 就 有 很 多 电话 ， 都 是 投诉 性 能 问题 的 ， 我 正在 处 理 呢 。 
白 哥 ， 于 哥 ， 你 们 快 帮 着 看 看 。 

老 于 也 装模作样 地 在 OMS 服务 器 上 翻 着 ， 一 边 看 一 边 还 跑 吐 咕 咕 的 :“ 怪 了 ,怎么 今天 业务 
量 这 么 大 ， 好 多 没 见 过 的 SQL， 看 样子 CPU 是 撑 不 住 了 。 老 白 ， 马 上 向 孙 主 任 汇 报 吧 。 

我 和 小 孙 说 ， 看 样子 必须 向 孙 主 任 汇 报 了 ， 小 孙 ， 你 也 向 范 总 汇报 一 下 吧 ， 你 们 的 应 用 要 抓 
紧 改 了 ， 否 则 撑 不 过 这 个 月 底 了 。 说 完 ， 我 就 接 通 了 和 孙 主 任 的 电话 :“ 孙 主任 ， 今 天 系统 负载 太 
大 了 ， 您 那 边 是 不 是 有 什么 新 业务 上 线 啊 。 哦 ， 原 来 是 这 样 啊 ， 这 个 模块 能 不 能 不 开 ， 哦 ， 不 行 
啊 ， 如 果 这 个 模块 必须 开 的 话 ， 那 么 开发 商 那 边 的 SQL 修改 要 提前 了 ， 否 则 这 几 天 会 撑 不 住 的 。 
好 的 ， 我 把 电话 拿 给 小 孙 ， 他 正在 向 范 总 汇报 这 个 事情 。” 

小 孙 还 在 结 结巴 巴 地 向 领导 汇报 , 我 说 :“ 小 孙 ， 孙 主任 找 你 ,我 先 和 范 总 说 两 句 吧 。” 说 着 
我 把 电话 递 给 小 孙 ， 顺 手 把 小 孙 的 电话 接 了 过 来 。 范 总 ， 您 好 。 看 样子 必须 您 老 亲 自 出 马 摆 平 
T, SQL 估计 要 提前 上 线 了 ， 否 则 系统 撑 不 住 了 。 什 么 ， 那 几 个 模块 能 不 能 再 停 一 下 ， 不 行 了 ， 
已 经 停 了 快 2 个 月 了 ,营业 员 必 须知 道 自己 的 考核 指标 ,否则 发 绩效 工资 时 大 家 又 会 阅 了 。 营 业 
厅 那 边 闹 得 很 厉害 ， 孙 主任 也 压 不 住 了 。 范 总 ， 其 实 那 几 个 SQL, 你 找 两 个 人 ,估计 两 三 天 也 搞 
定 了 。 您 这 边 再 按兵不动 ， 孙 主任 和 我 这 边 实 在 是 挺 不 住 了 。 好 的 ， 有 具体 你 还 是 和 孙 主 任 通 个 电 
TAME, Ab, 老兄， 实际 上 那 几 个 绩效 模块 ， 你 只 要 限制 一 下 查询 时 间 的 跨度 ， 就 不 会 出 现 现在 
的 情况 了 。 做 这 么 点 调整 ， 小 王 他 们 那 边 随便 出 个 人 ， 半 小 时 之 内 就 搞定 了 。” 看 到 范 总 有 点 急 
了 ， 我 觉得 这 回 可 能 有 戏 。 

那 思 小 孙 也 已 经 和 和 孙 主 任 通 完 电 话 了， 也 是 一 脸 的 凝重 。 我 安慰 小 孙 ,“ 和 公司 好 好 协调 一 
下 ， 别 自己 一 个 人 打 着 。 真 出 了 问题 ， 公 司 肯定 不 会 表扬 你 为 公司 坚持 原则 ， 出 了 问题 , 责任 肯 
定 是 你 一 个 人 担 着 , 你 有 必要 替 公 司 去 承担 这 么 大 责任 吗 ? 还 是 把 这 里 的 真实 情况 向 范 总 好 好 汇 
报 一 下 ， 让 他 下 决心 加 快 SQL 优化， 如果 这 回 优化 成 功 ， 那 么 你 今后 也 轻松 多 了 。” 旁 边 的 投诉 
热线 又 响 了 起 来 ,小 孙 又 忙 着 接 电话 去 了 。 看 样子 , 今天 是 消停 不 了 了 。 希望 能 通过 这 件 事 给 范 
总 这 个 老 狐 狸 足够 的 压力 ， 甚 至 一 劳 永 逸 地 解决 问题 。 

过 了 没 多 久 , 小 王 打 电 话 过 来 通知 我 们 ， 说 中 午 有 一 个 紧急 补丁 要 发 布 ， 估 计 需 要 停机 1 个 
小 时 。 我 问 小 王 ， 是 什么 补丁 这 么 急 着 发 布 。 小 王 说 :“ 白 哥 ， 还 不 是 你 给 我 找 的 事情 ， 范 总 刚 
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才 打 电话 来 ， 让 我 马上 把 绩效 考核 查询 的 时 间 区 间 做 个 限制 ， 不 能 跨 月 度 进行 统计 查询 。” 范 总 
不 愧 是 在 江湖 上 混 了 那么 多 年 的 高 手 ， 都 到 这 个 时 候 了 ， 他 还 能 这 么 冷静 地 拆 招 。 

和 老 于 商量 了 一 下 ,我 马上 把 这 个 情况 和 孙 主 任 通报 了 一 下 ， 范 总 还 是 想 修 修补 补 ， 不 想 按 
照 我 们 的 思路 去 做 。 

孙 主 任 想 了 想 说 如 果 中 午 发 布 了 修改 后 的 程序 ,那么 今天 下 午 系统 是 不 是 能 够 得 到 缓解 。 我 
说 如 果 修 改 了 程序 ， 系 统 应 该 能 撑 得 住 ， 系 统 情况 会 比 上 午 好 很 多 。 

“MELI, MA? ” 孙 主 任 也 对 范 总 没有 办 法 了 。 

“ 孙 主 任 ， 只 要 你 那 边 能 顶 得 住 ， 我 肯定 有 办 法 。 不 过 今天 下 午 可 能 还 会 有 大 量 的 投诉 ， 你 
们 部 门 的 压力 不 小 ， 有 具体 怎么 做 你 就 不 需要 知道 了 ， 出 了 问题 你 帮 有 我 忽 着 就 行 了 。” 看 到 范 总 这 
个 样子 ， 我 也 只 能 下 狠 招 了 ， 我 找 出 几 个 以 前 性 能 很 差 的 统计 模块 ， 改 了 改 ， 让 这 几 个 模块 每 隔 
两 三 分 钟 跑 一 次 ， 这 样 就 可 以 消耗 大 量 的 系统 资源 ， 下 午 系统 性 能 想 好 也 不 那么 容易 了 。 

中 午 小 王 发 布 补丁 前 , 我 就 把 这 几 个 模块 的 定期 执行 脚本 放 到 了 OSW 的 脚本 里 , 每 次 OSW 
采集 操作 系统 数据 时 ， 就 会 顺带 跑 一 下 这 几 个 大 查询 。 有 果然 和 我 想象 的 一 样 ， 补 丁 发 布 后 ， 系 统 
性 能 并 没有 出 现任 何 好 转 。 小 王 让 我 分 析 了 一 下 系统 ， 我 说 :“ 小 王 你 发 布 的 补丁 是 起 作用 了 ， 
SQL 的 执行 效率 提高 了 几 十 倍 ， 不 过 架 不 住 查询 太 多 了 ,整个 系统 的 资源 瓶颈 太 严 重 ， 所 以 你 的 
这 个 修改 也 只 是 杯水车薪 。 

下 午 3 点 多 ,我 觉得 小 王 应 该 已 经 向 范 总 汇报 过 情况 了 ， 就 打 电 话 告诉 孙 主 任 ， 需 要 他 出 马 
再 去 将 范 总 一 军 了 。 果 然 ， 我 和 孙 主 任 的 电话 打 完 还 不 到 半 个 小 时 ， 小 王 就 打 电 话 过 来 说 :“ 白 
哥 ， 范 总 已 经 通知 我 安排 资源 加 快 SQL 优化 了 ， 不 过 我 们 最 近 人 手 实在 是 特别 紧张 ， 我 只 能 安 
排 两 三 个 人 出 来 ,你 明天 能 不 能 到 我 们 这 里 来 上 班 ， 教 教 他 们 该 怎么 做 。 我 们 范 总 明天 会 和 你 联 
Ro 

我 长 出 了 一 口气 ， 范 总 这 个 老 狐 狸 终 于 开始 和 我 们 配合 了 。 我 马上 打 电 话 告诉 孙 主 任 , 平安 
无 事 了 。 
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项 目 做 到 这 种 地 步 ， 需 要 通过 这 种 手段 来 逼 开发 商 改 应 用 ,也 确实 是 够 难受 的 。 不 过 这 并 不 
是 老 白 的 虚构 ， 而 是 真实 经 历 。 不 过 实际 的 故事 不 是 发 生 在 这 个 项 目 里 ， 老 白 把 这 段 写 进来 的 目 
的 是 为 了 制造 一 个 小 的 悬念 。 实 际 上 ,本 书 虽然 以 沈阳 这 个 项 目 为 蓝本 ,但 讲述 的 仍然 是 一 个 虚 
构 的 项 目 ， 因 此 参与 过 沈阳 这 个 项 目的 人 请 原谅 我 的 艺术 加 工 。 


E Siea) Top 5 事件 
在 做 性 能 优化 的 过 程 中 , 抓 住 主要 矛盾 是 十 分 重要 的 。 数 据 库 性 能 方面 的 指标 十 分 复杂 ， 优 


化 过 程 中 也 是 千 头 万 绪 。 因 此 解决 主要 的 性 能 问题 , 尽 可 能 少 地 改动 系统 就 能 达到 优化 目的 是 十 
分 重要 的 。STATSPACK 报告 中 的 Top 5 事件 就 是 我 们 抓 住 系统 关键 问题 的 一 把 钥匙 ，Top 5 等 待 
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事件 是 系统 中 最 重要 的 等 待 事件 。 解 决 Top 5 等 待 事件 是 进行 数据 库 优化 的 关键 。 从 Oracle 9i FF 
始 ，Top 5 等 待 事件 被 改 为 Top 5 Timed Events。 因 为 本 市 可 能 包含 CPU time 这 类 非 等 待 事件 ， 
所 以 Top 5 Timed Events 更 为 贴切 。 下 面 是 一 个 例子 : 


Top 5 Timed Events 








~ $ Total 
Event Waits Time (s) Ela Time 
db file sequential read 11,329,122 153,771 79.27 
CPU time 22,660 11.68 
buffer busy waits 744,501 11,596 5.98 
db file scattered read 173,282 4,602 2.37 
db file parallel write 30,423 392 .20 


在 一 个 性 能 比较 良好 的 系统 中 ， 大 多 数 数据 库 的 db file sequential read 和 db file scattered read 
可 能 是 排 在 最 前 面 的 等 竺 事件。 从 这 个 报告 上 看 ，db file sequential read 占 了 整个 等 待 事件 的 
79.27%, 因此 后 面 需要 详细 分 析 一 下 这 个 等 待 事件 ,这 个 事件 是 由 于 单 块 读 引起 的 。 排 在 第 二 位 
的 是 CPU time。 对 于 一 些 等 待 事件 比较 小 或 者 高 开销 SQL 比较 严重 的 系统 ， 这 个 等 待 事件 可 能 
会 排 在 第 一 位 。 这 个 事件 是 由 于 SQL 执行 、 分 析 等 消耗 CPU 资源 的 行为 带 来 的 。 buffer busy waits 
是 由 于 热 块 等 待 造成 的 等 待 事件 。 在 这 里 ， 这 个 等 待 事件 为 6% 左右 ,说 明 系 统 中 还 是 存在 一 定 
的 热 块 冲突 。db file scattered read 等 待 事件 是 由 于 全 表 扫 描 或 者 全 索引 扫描 引起 的 ， 其 特点 是 多 
块 读 ， 对 某 个 对 象 进行 扫描 。 不 能 片面 地 认为 db file scattered read 就 是 全 表 扫 描 ， 存 在 这 个 等 待 
事件 并 不 说 明 SQL 一 定 存在 问题 ,因为 有 些 应 用 进行 全 表 扫 描 或 者 全 索引 扫描 是 正常 的 。db file 
parallel write 是 写 入 数据 文件 产生 的 等 待 。 在 这 个 系统 中 ， 这 个 等 待 事件 所 占 比 例 很 低 ， 可 以 不 

本 书 将 会 给 出 一 些 常见 的 Oracle 事件 以 及 状态 值 的 定义 ， 不 过 更 多 的 信息 需要 DBA 在 日 党 
工作 中 积累 。Oracle Wait Interface 是 一 本 很 不 错 的 关于 OWI 的 书 ， 建 议 大 家 阅读 。 


Eutr) 常见 事件 清 
常见 事件 清单 如 下 表 所 示 。 


名 FR 说 有明 


CPU used by this session 统计 调用 发 起 开始 到 结束 的 CPU 时 间 乒 的 数量 。 每 个 计数 代表 一 个 CPU 有 周 
期 ,也 就 是 10ms。 不 过 如 果 有 一 个 调用 不 足 一 个 CPU 周 期 就 执行 完了 ， 那 么 
统计 值 时 起 始 时 间 和 结束 时 间 是 相同 的 ， 这 样 会 计算 为 0 这 个 计数 基本 上 可 以 
代表 Oracle 数 据 库 消 耗 的 CPU 资 源 ， 不 过 计算 时 要 注意 单位 是 厘 秒 (cs) ， 乘 
以 10 就 可 以 换算 成 毫秒 (ms) 。 比 如 平均 每 秒 这 个 值 是 782.1，, 表示 Oracle 消 耗 
了 7 821 毫 秒 CPU 时 间 ， 如 果 这 个 系统 是 一 个 16 颗 CPU 的 系统 ， 那 么 这 个 值 可 
以 说 明 Oracle 消 耗 了 超过 50% 的 CPU 资源 。 不 过 由 于 部 分 小 的 调用 可 能 由 于 消 
耗 时 间 小 于 10ms 而 没有 计算 进去 ， 实 际 的 使 用 率 可 能 略 高 于 通过 这 个 值 计 算 
出 来 的 。 一 般 来 说 ， 大 多 数 调用 消耗 的 CPU 都 会 大 于 10ms， 所 以 这 个 值 还 是 
能 够 基本 反映 出 Oracle 对 CPU 资源 的 开销 


































































































( 续 ) 
名 称 说 明 
CR blocks created 当前 块 被 克隆 后 用 于 创建 CR (Consistent Read) H, 被 克隆 的 主要 原因 是 缓 


current blocks converted for CR 


DBWR buffers scanned 


DBWR checkpoint buffers written 


DBWR free buffers found 


DBWR make free requests 


DBWR summed scan depth 


DBWR timeout 


DBWhR transaction table writes 


DBWR undo block writes 

DDL statements parallelized 

DML statements parallelized 
background checkpoints completed 


background checkpoints started 


branch node splits 


buffer deadlock 


buffer is not pinned count 


buffer is pinned count 


change write time 


























冲 区 被 韭 兼容 的 模式 占用 ， 如 果 单 位 时 间 内 CR blocks created 值 比较 高 ， 说 明 
数据 库 中 对 某 些 数据 块 的 修改 和 访问 比较 频繁 。 如 果 这 些 访问 集中 在 某 些 热 块 
E, 那么 可 能 会 形成 较为 严重 的 bufferbusy waits ， 在 RAC 环 境 中 ， 可 能 还 会 导 
致 全 局 热 块 冲突 。 如 果 这 个 值 比较 高 , 那么 应 该 关注 buffer busy waits 以 及 cache 
buffer chains 门 锁 等 

一 个 当前 的 buffer 在 使 用 前 生成 了 CR 
当 某 些 触发 条 件 发 生 时 ，DBWR 会 在 LRU 链 的 冷 端 开始 扫描 脏 块 ， 组 成 
DBWR batch, 这 个 值 统 计 的 是 DBWR 在 LRU 上 扫描 的 buffer 的 总 数 ， 包 含 脏 块 
和 干净 的 块 。 这 个 值 除 以 DBWR LRU scans 就 是 每 次 扫描 查找 的 数据 块 的 数量 

检查 点 时 DBWR 写 入 的 脏 块 数量 。 如果 在 单位 时 间 里 这 个 值 比 较 高 , 说 明 系 
统 中 数据 块 的 变更 较为 频繁 

DBWR 从 LRU 链 中 扫描 buffer 时 发 现 的 空闲 的 buffer 的 数量 ， 除 以 DBWR 
make free requests 就 是 平均 每 次 DBWR 在 收 到 DBWR make free 消 息 时 扫描 LRU 
链 找到 的 空闲 buffer 的 平均 数 ， 这 个 平均 数 一 般 会 比较 少 

DBWR 收 到 的 make free 消 息 的 数量 。 如 果 某 个 前 台 进 程 无 法 找到 空间 的 
buffer 时 ， 会 向 DBWR 发 出 make free 消 息 。 如 果 单 位 时 间 内 这 个 值 较 高 ， 说 明 
DB Cache 可 能 存在 不 足 的 现象 

DBWR 扫 描 LRU 链 查找 脏 块 时 , 查找 的 puffer 的 数量 。 这 个 数 越 大 , 说 明 LRU 
链 尾 部 的 脏 块 数量 越 少 。 从 Oracle 8i 开 始 ， 由 于 LRU 链 的 算法 发 生 了 变化 ， 所 
以 如 果 LRU 链 尾部 的 热 块 比较 多 ， 也 可 能 造成 这 个 值 较 大 

DBWR idle 超 过 一 个 特定 值 , 该 值 就 会 加 1。 如 果 该 值 较 高 , 说 明 Buffer Cache 
中 的 数据 变化 较 小 ， 需 要 写 入 磁盘 的 脏 块 数量 极 少 

DBWR 写 入 的 回 深 段 头 的 数量 。 该 值 比较 高 说 明 有 较 多 热 块 正在 被 写 入 , 而 
大 量 用 户 进 程 在 等 待 这 些 块 写 入 完成 

DBWR 写 入 回 深 段 的 数据 块 数量 

DDL 操 作 并 发 执行 的 计数 

DML 操 作 并 发 执行 的 计数 
后 台 进 程 完成 的 checkpoint 的 数量 
后 台 进 程 启动 的 checkpoint 的 数量 ， 可 能 比 上 一 个 状态 的 值 大 一 些 。 这 个 状 
态 只 包含 重 做 的 checkpoint， 不 包括 其 他 类 型 的 checkpoint， 比 如 OFFLINE 文 件 
或 者 BEGIN BACKUP 或 者 ALTER SYSTEM CHECKPOINT LOCAL 命 令 等 

由 于 插入 数据 导致 的 索引 枝 节 点 分 裂 的 数量 。 这 个 值 较 高 说 明 目 前 存在 索引 
产生 了 较 多 的 枝 节 点 分 裂 , 可 能 某 张 表 上 的 某 个 索引 字段 变化 十 分 频繁 , 这 种 
频繁 的 变化 可 能 对 某 个 应 用 的 性 能 有 较 大 的 影响 

DB Cache 死 锁 的 数量 计数 。 如 果 单 位 时 间 内 该 值 较 高 ， 可 能 DB Cache 存 在 
性 能 问题 ， 或 者 存在 某 些 bug 
当 访 问 一 个 buffer 时 ， 这 个 buffer 已 经 释放 的 数量 。 只 用 于 Oracle 内 部 调试 ， 
并 不 说 明 性 能 问题 
当 访 问 一 个 buffer 时 ， 该 buffer 已 经 被 PIN 住 了 。 如 果 单 位 时 间 内 这 个 值 比 较 
高 ， 说 明 可 能 存在 热 块 
当前 块 的 变化 被 写 入 redo 的 时 间 ， 单 位 为 厘 秒 (cs，10ms ) 。 
太 大 。 如 果 太 大 ， 就 需要 分 析 





















































































































































该 值 一 般 不 会 

















240 Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 
( 续 ) 
名 称 说 明 
commit cleanout failures: block lost 在 COMMIT 时 ， 准 备 做 块 清理 操作 时 ， 发 现 不 能 找到 正确 块 的 次 数 计数 


commit cleanout failures: buffer 


being written 
commit cleanout failures: callback 
failure 


commit cleanout failures: cannot pin 


commit  cleanout failures: hot 


backup in progress 


commit cleanout failures: write 


disabled 
commit cleanouts 


commit cleanouts successfully 


completed 


consistent changes 


consistent gets 


data blocks consistent reads - undo 


records applied 


deferred (CURRENT) block 


cleanout applications 


dirty buffers inspected 


enqueue waits 








的 计数 。 如 果 该 值 比较 高 ， 可 能 说 明 存 在 热 块 





Oracle 在 COMMIT 时 ， 云 清除 puffer 时 ， 发 现 这 个 buffer 正 在 被 











其 他 会 话 写 入 








Oracle 在 COMMIT 时 ， 做 清除 操作 时 调用 回调 函数 返回 FALSE 的 计数 








Oracle 在 COMMIT 时 ,做 清除 操作 时 无 法 PIN 到 这 个 buffer 的 计数 。 有 可 能 在 











准备 清理 时 该 buffer 又 被 其 他 会 话 PIN 住 了 。 如 果 该 值 较 高 , 可 以 查看 DB Cache 
相关 的 情况 ， 包 括 DB Cache 的 大 小 、 命 中 率 、 相 关门 锁 的 命中 率 以 及 热 块 争 











用 的 情况 

Oracle 在 COMMIT 时 ， 做 清除 操作 
buffer 在 被 修改 前 ， 必 须 先 被 写 人 Log Buffer， 以 确保 数据 库 恢 
断裂 











时 发 现 正在 做 热 备份 的 计数 。 此 时 这 个 


复 时 不 会 产生 块 


Oracle 在 COMMIT 时 ， 做 清除 操作 时 发 现 数据 库 的 写 操作 暂时 被 关闭 了 。 这 


种 情况 出 现 得 很 少 

















在 COMMIT 时 做 块 清除 工作 的 计数 ， 无 论 成 功 与 否 计数 器 都 会 加 1 


COMMIT 时 成 功 完成 cleanouts 的 计数 。 这 个 值 和 上 一 个 值 相 比 ,两 个 值 应 该 
较为 接近 (这 个 值 略 低 一 些 ) 。 如 果 这 两 个 值 相差 太 大 ， 需 要 分 析 DB Cache 
是 否 存在 过 小 的 问题 ， 或 者 应 用 中 是 否 经 常 对 大 表 进 行 大 数据 量 的 修改 操作 








数据 块 提交 了 undo 信 息 成 为 CR 块 的 计数 。 这 个 值 阅 明了 系统 中 CR 块 产生 的 


数量 。 这 个 值 越 大 ， 越 要 注意 cache buffer chains 等 门 锁 的 情况 
性 能 的 影响 








一 致 性 读 的 计数 。 会话 发 出 的 对 某 个 数据 块 进行 一 致 性 读 的 请 求 。 不 能 将 雪 





以 及 热 块 对 系统 























与 consistent changes 混 淆 。 一 个 CR 块 产生 后 ， 可 能 被 多 个 consistent gets 事 件 调 





使 使 用 ， 因 此 这 个 值 要 比 前 一 个 值 大 得 多 
从 undo 中 读 取 数据 ， 形 成 CR READ。 本 计数 器 记录 从 undo 














中 获取 undo 记 录 














的 计数 。 如 果 这 个 值 较 大 , 说 明 对 于 某 些 修改 较为 频繁 的 表 的 查询 和 其 他 操作 


也 很 频繁 ， 有 可 能 存在 热点 表 和 索引 

















做 延迟 块 清除 操作 的 计数 。 在 提交 时 该 数据 块 





FHC 

















法 马上 做 块 清除 工作 。 这 种 情况 下 ,这 个 数据 块 就 会 做 延迟 块 清除 ,延迟 块 清 





除 操作 可 能 在 下 次 该 数据 块 被 查询 时 进行 。 这 种 情况 也 导致 有 
做 SELECT 操作 时 也 会 产生 大 量 的 redo 


当 某 个 会 








时 候 我 们 会 看 到 





话 在 LRU 链 的 冷 端 开始 查找 空闲 的 数据 块 时 查 到 一 个 脏 块 , 这 个 值 


就 会 增加 。 如 果 单位 时 间 内 该 值 较 大 ,说 明 LRU 链 的 冷 端 存在 较 多 的 脏 块 。 出 








现 这 种 情况 有 几 种 可 能 : 





(1) 系统 中 的 脏 块 数量 十 分 巨大 ， 而 且 DBWR 的 写 入 速度 不 足 ， 从 而 导致 








DBWR 无 法 尽快 将 这 些 脏 块 写 入 硬盘 ， 
(2) 部 分 buffer 特 别 热 ， 并 且 被 更 改 的 频率 特别 高 ， 从 而 造成 
在 大 量 这 样 的 块 ， 




















LRU 链 的 尾 端 存 


(3) 本 系统 是 一 个 以 DMIL 为 主 的 系统 ， 数 据 块 的 变更 十 分 频繁 。 
碰 到 这 种 情况 ， 可 以 关注 一 下 DBWR 的 性 能 ， 并 且 关 注 一 下 DB Cache 的 命 














中 率 及 cache buffer chains 等 门 锁 的 情况 
等 待 各 种 锁 的 计数 








说 ĦA 





exchange deadlocks 


free buffer inspected 


global cache freelist waits 


global lock convert time 


hot buffers moved to head of LRU 


immediate 


leaf node splits 


logons current 
opened cursors current 


opens of replaced files 


parse count (hard) 
parse count (soft) 
parse count (total) 
parse time cpu 


parse time elapsed 


physical reads direct 


physical writes direct 


(CURRENT) 
cleanout applications 


block 


physical writes non checkpoint 


pinned buffers inspected 


当 进行 两 个 buffer 交 换 时 ， 发 生 内 部 死 锁 的 计数 。 索 引 扫描 是 导致 这 种 交换 
的 唯一 因素 。 如 果 该 值 较 高 , 可 以 检查 是 否 存 在 十 分 热 的 索引 (可 以 通过 buffer 
busy waits 分 析 来 定位 ) 
从 LRU 队 列 的 尾部 扫描 可 重用 的 buffer 时 跳 过 的 buffer 的 数量 
当 ping 一 个 buffer 时 ， 由 于 所 有 的 lock element 都 被 使 用 而 引起 的 等 待 
司 步 全 局 锁 的 转换 时 间 (单位 是 10ms)。 这 个 值 较 高 说 明 全 局 锁 冲 突 较 为 严 
， 需 要 检查 cluster interconnect 的 性 能 
当 一 个 热 块 到 达 LRU 队 列 的 尾部 时 ，Oracle 自 动 会 把 这 个 块 移动 到 LRU 队 列 
的 头 上 ， 以 便于 使 之 能 够 继续 被 使 用 。 每 发 生 一 次 这 样 的 操作 ,这 个 计数 就 加 
一 。 值 得 注意 的 是 ， 从 Oracle 8i 开 始 ，LRU 的 算法 发 生 了 变化 ， 通 过 引入 TCH 
计数 来 确定 热 块 , 而 不 是 通过 将 热 块 在 LRU 链 上 移动 来 保证 热 块 不 被 过 早 地 换 
出 。 如 果 热 块 存在 于 LRU 链 的 尾部 ,扫描 时 发 现 了 热 块 , 会 主动 跳 过 ， 从 而 保 
正 热 块 不 被 过 早 地 重用 
获取 BUFFER 后 ， 立 即 进行 记录 清除 操作 的 计数 
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当 INSERT 发 生 后 ， 导 致 索引 叶 节 点 分 裂 的 次 数 。 一 般 来 说 ， 对 于 插入 较为 
频繁 的 系统 ,这 个 值 一 般 会 比较 高 。 除 非 出 现 叶 布点 热 块 较为 严重 的 现象 , 一 
般 来 说 不 需要 特别 关注 该 什 
前 登录 数据 库 的 计数 
前 打开 的 游标 的 数量 
件 由 于 不 在 打开 文件 缓冲 中 而 重新 打开 的 计数 。 每 个 Oracle 会 话 都 有 一 个 
文件 打开 缓冲 区 ， 保 持 部 分 打开 的 数据 文件 的 句柄 ， 以 避免 重复 打开 文件 

硬 分 析 的 统计 值 。 该 值 需要 和 parse count (totaD) 对 比 来 看 硬 分 析 的 比例 

软 分 析 的 统计 值 

发 生 的 parse call 的 总 数 

parse 消 耗 的 CPU 的 统计 ， 单 位 是 10ms 

pase 的 持续 时 间 ， 单 位 是 10ms。 这 个 值 减 去 parse time cpu 就 是 parse 中 等 待 的 
时 间 。 如 果 parse time cpu 占 整个 parse time elapsed 的 比例 较 低 ， 说 明 parse 中 等 
待 时 间 过 长 ， 可 能 共享 池 存 在 性 能 问题 ， 需 要 进行 分 析 
直接 物理 读 的 数量 。 读 时 不 经 过 buffer。 一 般 发 生 这 种 操作 的 情况 有 : 排序 
操作 、 并 行 查询 操作 的 从 属 进程 或 者 预 读 
直接 写 的 数量 ， 不 经 过 buffer， 直 接 写 入 。 一 般 发 生 这 种 操作 的 情况 有 : 

a 直接 装载 操作 ， 比 如 CREATE TABLE AS SELECT; 

a 并行 DML 操 作 ， 

a 排序 操作 中 的 临时 表 空 间 写 入 ， 

a 写 和 人 没有 缓冲 的 LOB 字 段 

非 checkpoint 引 起 的 物理 写 。 物理 写 的 发 生 情 况 包 括 checkpoint 或 者 无 足够 的 
空闲 buffer 可 用 , 或 者 DBWR 超 时 等 。 一般 情况 下 , 这 个 值 会 超过 physical writes 
的 一 半 以 上 ， 除 非 是 checkpoint 十 分 频繁 的 系统 。 如 果 该 值 占 physical writes 的 
比重 比较 少 ， 应 该 进行 分 析 
当 一 个 用 户 进程 扫描 replacement 列 表 ， 寻 找 一 个 可 重用 的 buffer 时 ， 发 现 一 
个 冷 块 被 PIN 了 或 者 有 一 个 PIN 请 求 的 等 待 事件 。 这 种 情况 很 少 发 生 ， 因 为 冷 
块 很 少 会 被 PIN。 如 果 平 均 每 秒 该 值 较 大 ， 需 要 进行 分 析 
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(5) 
Z —H 8f 





queries parallelized 
recursive cpu usage 
recovery array read time 
recovery array reads 
recovery blocks read 
redo entries 


redo entries linearized 


redo buffer allocation retries 


redo log space requests 


redo log space wait time 


redo size 
redo synch time 


redo sync writes 


redo wastage 


redo writer latching time 


并 行 查询 执行 的 次 数 统计 
非 用 户 调用 的 CPU 时 间 











时 产生 的 1/0 的 次 数 





Rip Rp Ru 


=< = = 


时 产生 的 IO 消耗 的 时 间 


时 读 取 的 数据 块 的 数量 


当 一 个 redo 信 息 被 复制 到 Log Buffer 时 ， 这 个 计数 会 增加 
小 于 等 于 REDO_ENTRY_PREBUILD_THRESHOLD 的 redo entries 的 数量 。 这 些 redo 


entries 可 以 并 发 生成 , 不 需要 受 门 锁 的 限制 , 但 是 会 增加 CPU 的 消耗 。 在 多 CPU 








的 系统 中 ， 这 个 值 会 比较 高 











当 申 请 redo buffer 时 重 试 的 次 数 。 一 般 来 说 ， 重 试 发 生 的 原因 是 redo writer 
还 没完 成 或 者 日 志 切 换 正 在 进行 。 如 果 该 值 较 高 , 说 明 重 做 日 志 产 生 的 频率 很 
高 ，LGWR 无 法 及 时 刷新 Log Buffer， 可 以 考虑 加 大 Log Buffer 的 大 小 。Log 


Buffer 一 般 可 以 为 几 兆 到 几 十 睁 。 不 过 


















































于 很 多 数据 库 版 本 中 存在 bug， 因 此 





不 建议 将 Log Buffer 设 置 得 过 大 。 一 般 来 说 ，30MB ~40MB 对 于 绝 大 多 数 系统 
来 说 都 是 足够 的 。 如 果 是 由 于 等 待 日 志 切换 ， 那 么 可 能 存在 的 问题 包括 ， 




















a 重 做 日 志文 件 过 小 ; 
a 重 做 日 志 IO 性 能 不 佳 ; 














a 数据 文件 的 VO 性 能 不 佳 导致 DBWR 写 入 较 慢 ， 

a DBWR 的 数量 太 少 ， 导 致 DBWR 的 写 入 性 能 不 足 

当前 活跃 的 日 志文 件 满 了 ，Oracle 必 须 等 待 日 志 切 换 完成 后 才能 分 配 重 做 日 
志 磁 盘 空 间 , 此 时 就 会 产生 这 个 等 待 。 如 果 SGA 的 大 小 和 日 志文 件 的 大 小 不 匹 








配 ， 并 且 系 统 中 





的 CoMMIT 操 作 十 分 频繁 。 当 








如 果 这 个 统计 值 较 高 ， 建 议 检查 以 下 几 个 方面 
口 重 做 日 志文 件 的 IO 性 能 是 否 存在 问题 ， 如 果 log file parallel write 的 平均 耗 





时 较 大 , Baik AS A 








好 的 磁盘 上 ， 


n Log Buffer 的 大 小 是 否 过 小 ; 











口 应 用 软件 中 
记录 都 提交 





L b Lf 
EHEU 











redo log space requests 的 等 待 时 间 (单位 为 厘 秒 ) , 


一 起 看 
生成 的 所 有 redo 的 大 小 ， 自 








redo synch 调 用 消耗 的 时 间 
一 般 来 说 redo 信 息 生 成 后 ， 











位 是 字 节 
， 单 位 是 10 毫 秒 BD) 





会 被 复制 到 Log BufferH 





redo log 文 件 ， 而 lgwr 会 周期 














日 志 切 换 时 ，DBWR 需 要 把 已 经 
提交 的 脏 块 也 写 人 磁盘, 在 这 些 脏 块 写 入 磁盘 完成 前 ， 日 志 切 换 不 能 完成 。 在 
这 种 情况 下 ， 这 个 统计 值 会 比较 高 。 











日 现 了 问题 ， 建 议 将 重 做 日 志 放 到 性 能 
或 者 将 重 做 日 志文 件 独立 存放 ， 避 免 O 冲 突 ， 








的 提交 可 能 过 于 频繁 , 建议 采用 批量 提交 的 方式 ,而 不 要 每 条 


这 个 值 需要 和 上 一 个 值 








FF ， 并 不 需要 马上 被 写 人 











性 将 这 些 数据 写 入 重 做 日 志文 件 。 不 过 如 果 事 务 

















提交 了 ， 那么 这 些 redo 信息 必须 马上 被 写 入 重 做 日 志文 件 ， 这 个 时 候 redo sync 


writes 计 数 器 会 增加 








在 把 Log Buffer 数 据 写 人 重 做 日 志文 件 时 ， 计 算 的 Log Buftfer 空 闲 的 空间 


LGWR 获 得 每 个 copy latch 的 时 间 (单位 为 厘 秒 ) 。 如 果 该 值 存在 问题 ， 需 要 
检查 重 做 日 志文 件 的 VO 性 能 以 及 Log Buffer 的 大 小 是 否 足够 。 这 个 值 只 有 在 
log_simultaneous_copies 大 于 0 时 才 有 意义 

















说 HB 





redo writes 


remote instance undo block writes 


remote instance undo header writes 


remote instance undo requests 


rollback changes - undo records 


applied 


rollbacks only - consistent read gets 


rows fetched via callback 


session cursor cache count 


session cursor cache hits 


sorts (disk) 


sorts (memory) 


summed dirty queue length 


switch current to new buffer 


table fetch by rowid 


table fetch continued row 


total file opens 
transaction rollbacks 


write clones created in background 


LGWR 将 Log Buffer 写 入 重 做 日 志文 件 的 计数 


如 果 远 程 实例 需要 读 取 某 个 undo 块 ， 需 要 这 个 实例 先 将 这 个 “ 脏 的 ”undo 
块 回 写 ， 这 个 计数 器 就 会 增加 
和 上 一 个 值 类 似 ， 只 是 写 入 的 是 undo header 
于 要 做 CR 而 从 远程 实例 中 请 求 undo 的 数量 。 如 果 这 个 值 较 大 ， 说 明 RAC 
中 的 某 些 数据 块 经 常 在 实例 间 共 享 , 某 个 实例 修改 过 的 数据 也 正在 被 其 他 实例 
使 用 。 这 种 情况 下 ， 需 要 留意 CLUSTER INTERCONNECT 的 性 能 
当 用 户 需 要 进行 ROLLBACK 操 作 时 ， 提 交 undo 记 录 的 数量 。 当 事务 需要 回 滚 
时 , 需要 从 undo 中 取出 数据 , 并且 提 交 到 已 被 修改 过 的 数据 上 , 这 个 计数 和 系 
统 中 ROLLBACK 的 数量 以 及 每 次 ROLLBACK 的 记录 的 数量 有 关 
当 用 户 需 要 进行 CR READ 操作 时 ， 提 交 的 undo 记 录 的 数量 ， 此 时 并 没有 
buffer clear 操 作 发 生 。 当 进行 一 致 性 读 时 ， 也 需要 从 undo 中 取出 相关 的 数据 ， 
然后 生成 一 个 CR 块 ， 把 这 些 数据 提交 到 CR 块 上 ， 这 时 这 个 值 就 会 增加 
可 调 函 数 返 回 的 记录 数 。 该 统计 量 仅仅 用 于 内 部 调试 

会 话 游标 缓冲 区 的 计数 。 只 有 当 session_cacheq_cursors 大 于 0 时 才 有 意 
义 。 如 果 这 个 值 已 经 很 接近 其 至 达到 了 参数 中 session_cached_cursors 的 值 ， 
那么 说 明 这 个 参数 可 能 需要 加 大 

这 个 值 也 只 有 当 session_cacheq_cursors 大 于 0 时 才 有 意义 。 会 话 直 接 从 会 
话 游 标 缓冲 区 中 找到 某 个 SQL 的 计数 。 通 过 这 个 值 ， 可 以 看 出 游标 缓冲 区 产生 
的 作用 ， 可 以 将 这 个 值 和 parse count(total) 进 行 比较 

磁盘 排序 的 数量 。 如 采 平 均 每 秒 该 值 较 高 ， 需 要 检查 一 下 PGA_RAGGREGATE_ 
TARGET 参 数 是 否 设置 过 低 , 或 者 *_AREA_SIZE 是 否 设置 过 小 (PGA 手 工 管理 模 
A) 。 检 查 该 值 时 ， 同 时 应 该 查看 一 下 temp 表 空间 的 相关 文件 的 IO 性 能 。 如 
果 temp 表 空间 文件 的 VO 性 能 不 足 ， 需 要 加 大 PGA 的 配置 来 减少 硬盘 排序 

内 存 排序 的 统计 

每 次 写 请 求 发 生 时 , 脏 数据 块 链表 的 长 度 总 和 除 以 写 请 求 的 次 数 。 这 个 统计 
值 越 大 ， 说 明 系 统 中 需要 回 写 的 脏 块 较 多 

将 当前 buffer 移 动 到 另外 一 个 新 的 buffer， 原 有 的 buffer 成 为 一 个 CR 块 ， 这 种 
操作 的 次 数 
通过 ROWID 访 问 表 ， 这 种 操作 一 般 是 通过 索引 访问 ， 还 有 一 种 情况 是 SQL 
直接 通过 ROWID 去 访问 
如 果 访 问 某 一 行 数据 时 ,需要 访问 多 个 块 ， 那么 这 个 计数 器 就 会 增加 。 产 生 
这 种 情况 的 一 个 很 主要 的 原因 是 行 链 和 行 迁 移 。 如 果 某 个 表 的 PCT_FREE 设 置 
不 合理 ， 可 能 导致 更 新 时 产生 行 迁移 ， 这 样 就 会 增加 这 个 计数 。 

第 二 种 可 能 性 是 某 一 行 计数 的 长 度 相对 块 大 小 来 说 过 大 ,这样 一 行 数据 被 存 
储 在 多 个 块 中 的 机 会 就 较 大 。 这 种 情况 下 , 应 该 将 这 种 表 存 放 于 更 大 的 块 的 表 
空间 中 。 

还 有 一 种 可 能 性 就 是 系统 中 带 LOB 字 段 的 访问 较 多 , 因为 大 的 LOB 字 段 一 般 
来 说 采用 独立 的 segment 存 放 ， 所 以 访问 这 种 数据 也 会 增加 这 个 统计 值 

被 mstance 打 开 的 文件 的 数量 (包含 数据 文件 、 控 制 文件 、 重 做 日 志文 件 等 ) 

被 成 功 回 退 的 事务 总 数 

如 果 当 前 的 buffer 正 在 被 写 入 ， 那 么 后 台 进 程 或 者 前 台 进 程 克 隆 一 个 新 的 
buffer， 使 原来 的 buffer 的 写 入 可 以 继续 进行 
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( 续 ) 
名 你 说 HBH 
enqueue conversions 表 或 者 行 锁 的 转换 统计 
enqueue deadlocks 死 锁 统计 
enqueue releases 锁 释 放 统计 
enqueue requests 锁 申 请 统计 
enqueue timeouts 锁 申 请 超时 统计 





enqueue waits 锁 等 待 统 计 





rL en 
6A148 h 转 机 


今天 一 早 范 总 就 打 电 话 给 我 , 希望 我 们 能 够 派 个 人 和 他 们 现场 的 项 目 经 理 协 调 , 协助 他 们 尽 
快 把 12 张 表 连 接 的 SQL 修改 完毕 。 范 总 是 个 明和 白人， 他 也 很 清楚 这 个 SQL 给 系统 造成 的 影响 。 
如 果 能 通过 这 个 SQL 优化 解决 系统 的 主要 问题 ， 那 么 其 他 SQL 改 不 改 都 可 以 了 。 

其 实 范 总 这 个 思想 转变 我 昨天 就 听 小 王 说 了 。 不 过 为 了 防止 发 生意 外 , 昨天 的 那 几 个 大 查询 
还 是 继续 在 跑 着 ,今天 上 午 系统 的 性 能 虽然 没有 上 昨天 那么 糟糕 ,但 也 好 不 到 哪里 去 。 接 了 范 总 的 
电话 后 ， 我 觉得 不 会 再 出 什么 岔 子 了 ,于 是 把 那 几 个 查询 停 了 ， 然 后 就 去 了 小 王 那 里 。 小 王 正在 
和 几 个 开发 人 员 布 置 优化 的 事情 ， 见 到 我 来 了 很 高 兴 ， 说 :“ 白 哥 ， 我 们 必须 18 日 前 完成 修改 ， 
所 以 你 们 一 定 要 全 力 支 持 我 们 ,干脆 你 这 儿 天 就 到 我 们 这 里 上 班 算 了 ”。 

小 王 已 经 把 我 们 要 求 优化 的 30 多 个 SQL 都 安排 了 实施 责任 人 , 我 就 一 个 一 个 地 和 他 们 确认 
优化 方案 。 其 实 我 们 的 优化 方案 写 得 十 分 详细 ， 如 何 改写 SQL 都 很 明确 。 因 此 ， 只 花 了 不 到 一 
个 小 时 ， 几 个 开发 人 员 就 都 已 经 明确 了 方案 。 最 复杂 的 还 是 那个 12 张 表 连 接 的 SQL， 小 王 安 排 
了 一 个 工作 了 四 五 年 的 老手 小 侯 来 实施 。 实 际 上 ， 老 能 把 生成 SQL 的 一 个 存储 过 程 都 写 好 了 ， 
只 要 以 这 个 存储 过 程 为 核心 调整 一 下 ， 程 序 就 很 容易 实现 了 。 但 是 由 于 这 个 SQL 涉及 的 业务 十 
分 复杂 , 所 以 对 测试 的 要 求 十 分 高 。 我 和 小 侯 谈 方案 时 , 希望 他 先 花 一 两 天 时 间 把 测试 用 例 写 好 ， 
否则 一 旦 应 用 上 线 后 出 现 问 题 就 麻烦 了 。 

谈 了 一 圈 ， 大 家 的 任务 基本 上 也 明确 了 。 最 后 大 家 确定 了 一 下 工作 量 ， 觉 得 除了 12 张 表 连 
接 那 个 SQL 外 ， 其 他 程序 的 修改 和 测试 都 可 以 在 18 日 前 完成 ，19 日 凌晨 可 以 上 线 。 而 那个 12 
张 表 连 接 的 SQL， 小 侯 也 说 最 晚 20 日 可 以 完成 ，21 日 凌晨 可 以 上 线 。 按 照 这 个 进度 ， 虽 然 比 我 
们 的 预期 慢 了 一 周 ， 但 是 如 果真 的 能 在 25 日 前 30 多 个 SQL 全 部 上 线 ， 那 么 本 次 优化 的 效果 应 
该 十 分 明显 。 

早上 的 事情 让 我 今天 心情 大 好 。 中 午 吃 饭 时 和 老 于 讨论 下 一 步 的 工作 , 最 近 这 段 时 间 要 花 更 
多 的 时 间 在 文档 上 了 。 系 统 级 调整 基本 已 经 完毕 ,看 样子 效果 还 不 错 。SQL 优化 如 果 完 成 ,那么 
完成 这 个 优化 项 目的 预定 目标 是 肯定 没 问 题 了 。 还 有 就 是 ， 在 25 日 前 我 们 要 把 所 有 的 索引 全 部 
重新 重建 一 遍 ， 这 几 天 晚上 下 班 时 晚 走 一 会 儿 , 每 天 重建 一 部 分 就 可 以 了 ， 这样 就 省 得 客户 陪 我 
们 加 班 了 。 

我 们 除了 完成 优化 外 ， 在 验收 前 还 需要 提交 7 份 文档 ， 即 《优化 工作 界面 》《DBA 维护 工 
作 手 册 》 《系统 性 能 基线 报告 》 《系统 性 能 评估 指标 手册 》、 《系统 优 化 方案 》《 系 统 性 能 优化 评 






























































246 Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





估 报 告 》 和 《优化 工作 总 结 》。《 优 化 工作 界面 》 和 《系统 性 能 基线 报告 》 这 两 份 文档 在 前 期 已 经 
完成 了 。 剩 下 的 文档 还 没有 开始 编号， 这 段 时 间 工 作 比较 紧张 ， 所 以 也 没 顾 得 上 写 报告 ， 这 几 天 
重点 要 写 报告 了 。 老 于 分 了 一 下 工 ， 我 负责 《DBA 维护 工作 手册 》 和 《系统 优化 方案 》 的 编写 。 
这 两 个 文档 都 有 模板 ， 写 起 来 不 难 ， 就 是 量 比较 大 ， 工 作 量 不 小 。 

下 午 突然 接 到 青岛 那 边 万 科 长 的 电话 , 他 们 的 系统 遇 到 了 很 严重 的 性 能 问题 ,响应 速度 突然 
下 降 了 很 多 倍 。 万 科 长 他 们 是 通过 活跃 会 话 数量 突然 猛 增 意识 到 系统 出 问题 的 。 他 们 已 经 有 了 一 
个 经 验 性 的 指标 当 话 沃 会 话 的 数量 在 100—150 时 ， 系 统 是 正常 的 ， 如 果 活 跃 会 话 的 数量 超过 
200， 系 统 的 性 能 就 有 问题 了 。 而 今天 上 午 一 上 班 ， 活 跃 会 话 的 数量 就 高 达 300。 随 后 ， 投 诉 电话 
就 不 断 打 进 来 。 万 科 长 他 们 已 经 做 了 STATSPACK 报告 ， 并 且 已 经 发 到 了 我 的 邮箱 里 。 

立即 打开 邮箱 收 邮件 ， 发 现 Load Profile 中 的 信息 如 下 : 


Load Profile 




















———— Per Second Per Transaction 

Redo size: 203,292.09 5,850.14 

Logical reads: 110,127.43 3,169.14 

Block changes: 1,256.72 36.16 

Physical reads: 5,004.87 144.03 

Physical writes: 126.79 3:465 

User calls: 3,380.75 97.29 

Parses: 560.50 16.13 

Hard parses: 13.01 0:37 

Sorts: 31:81 0.92 

Logons: 0.46 0.01 

Executes: 800.51 23.04 

Transactions: 34.75 

$ Blocks changed per Read: 1.14 Recursive Call $: 27.47 
Rollback per transaction $: 1.61 Rows per Sort: 1896.84 


Instance Efficiency Percentages (Target 1002) 


Buffer Nowait $: 99.93 Redo NoWait % 100.00 
Buffer Hit $: 95.47 In-memory Sort % 99.99 
Library Hit $ 99.24 Soft Parse $ 97.68 
Execute to Parse $: 29.98 Latch Hit $: 99.75 
Parse CPU to Parse Elapsd $: 2.12 $ Non-Parse CPU: 96.75 
Shared Pool Statistics Begin End 
Memory Usage $: 79.88 78.79 
$ SOL with executions>1: 86.48 86.74 
% Memory for SQL w/exec»1: 99.28 99.08 
Top 5 Timed Events 
———— % Total 
Event Waits Time (s) Ela Time 


latch free 1,098,363 606,375 76.58 








6 月 14 日 4 机 24 
db file sequential read 11,615,630 73,616 9.30 
CPU time 55,262 6.98 
db file scattered read 2,377,376 26,913 3.40 
library cache pin 3,865 10,408 1.31 
latch free 占 了 76.58%, 484% Latch 争 用 的 情况 ， 发 现 : 
Pct Avg Wait Pct 
Get Get Slps Time NoWait NoWait 
Latch Requests Miss /Miss (s) Requests Miss 
Consistent RBA 295,240 0.0 0 0 
FAL request queue 10 0.0 0 0 
FIB s.o chain latch 194 0.0 0 0 
FOB s.o list latch 99,524 0:50 0.5 I 0 
SOL memory manager latch 3. 0.0 0 2,431 0.0 
SQL memory manager worka 500,795 0.0 0.6 2i 0 
XSKSFQP 49 0.0 0 0 
active checkpoint queue 25,960 0.0 0 0 
alert log latch 23 0.0 0 0 
archive control 300 0.0 0 0 
archive process latch 171 0.0 0 0 
cache buffer handles 2,868,069 0.1 0.3 125 0 
cache buffers chains 1,528,766,244 0.1. 0.4 Tiii 65,503,162 23.5 
cache buffers lru chain 1,667,682 0.6 0.2 782 69,088,014 3.8 
cas latch 52; 531; 336 0.1 0.3 3824 0 
channel handle pool latc 6,653 0.0 0 0 
channel operations paren 15,341 0.0 0 0 
checkpoint queue latch 5,245,583 0.0 0.2 7 817,925 0.0 
child cursor hash table 1,617,769 0.1 0:3 86 0 
direct msg latch 1,411,172 0.0 0.0 0 0 
dml lock allocation 1,714,958 0.2 05 304 0 
done queue latch 334,052 0.1 0.1 0 350,600 0.1 
dummy allocation 6,911 0.0 0 0 
enqueue hash chains 4,946,060 0.1 0,5. 752 0 
enqueues 4,910,923 0.2 0:5 815 0 
event group latch 3,325 0.0 0 0 
global tx hash mapping 649,208 0.0 0.6 0 0 
hash table column usage 1,169 0.3 0.5 5 32,482,472 540 
i/o slave adaptor T 0.0 0 0 
job workq parent latch 0 0 136 3. 
job queue processes para 280 0.0 0 0 
ksfv messages 1,744,965 0.0 0 17 0.0 
ktm global data 199 0.0 0 0 
kwqit: protect wakeup ti 239 0.0 0 0 
lgwr LWN SCN 295,394 0.0 O. 1 0 0 
library cache 5579517057 1.4 0.4 44673 111,360 533 
library cache load lock 154,232 0.0 0 0 
library cache pin 29,345,261 0.2 0.3 3074 0 
library cache pin alloca 21,024,601 0.2 0.5 3308 0 
list of block allocation 34,233 0.50 140 2 0 
loader state object free 442 0.0 0 0 
longop free list parent 18,593 0:0 0 2,498 Qu 
messages 943,063 0.0 0.5 17 0 
mostly latch-free SCN 3,957,459 0.1 0.2 57 0 
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msg queue latch 1,232 68.1 0.1 0 JA "X7 3 ¿Ü 
multiblock read objects 7,538,869 0.3 0.3 440 0 

ncodef allocation latch 141 0.0 0 0 

object stats modificatio 19 0.0 0 0 
post/wait queue 344,154 0.0 0.2 0 224,344 0.0 
process allocation 23, 226 0.0 1.0 0 37225 0. 


0 

cache buffers chains 等 待 出 现 了 严重 的 问题 。 本 来 想 今天 开始 静 下 心 来 写 报告 的 ， 看 来 今天 又 有 
事 做 了 。 从 现象 上 看 ， 这 是 典型 的 cache buffers chains 和 争 用 。 一 般 来 说 ， 和 应 用 程序 有 很 大 的 关 
系 。 我 首先 找到 了 几 个 Top SQL， 会 产生 几 百 万 其 至 上 千 万 的 缓冲 区 获取 。 我 打 电话 给 万 科 长 ， 
希望 开发 厂商 能 够 检查 一 下 这 几 个 SQL, 不 过 开发 商 那 边 的 反馈 是 程序 太 复杂 ， 可 以 优化 ， 但 是 
起 码 需要 一 个 月 的 时 间 。 我 也 研究 了 几 个 SQL, 都 是 超过 6 张 表 的 连接 ,其 中 每 个 连接 里 起 码 有 
两 三 张 超过 千 万 条 记录 的 大 表 , 光 是 执行 计划 就 有 几 十 行 ,， 想 要 简单 地 调整 一 下 索引 或 者 调整 一 
下 表 连 接 的 顺序 ， 很 难 达 到 优化 效果 。HCSP 系统 从 6 月 份 进 入 业务 高 峰 期 ， 这 个 业务 高 峰 要 持 
续 到 八 九 月 份 。 在 业务 高 峰 期 间 ， 业 务 量 会 比 平时 高 近 一 倍 。 往 年 每 年 进入 6 月 份 ， 系 统 性 能 都 
会 有 所 下 降 ， 而 从 今天 的 情况 来 看 ， 系 统 几 乎 是 不 可 用 了 。 从 各 个 维修 站 反馈 回来 的 信息 是 ， 目 
前 的 系统 查询 一 个 订单 ， 基 本 上 需要 S 分 钟 左 右 ， 而 之 前 只 需要 10 秒 左 右 。 看 样子 通过 应 用 进 
行 优化 的 路 子 行 不 通 ， 只 能 走 其 他 的 路 子 了 。 从 等 待 事件 看 : 


Event waits TimeOuts Total 
Wait Time(s) Avg wait (ms) waits/txn 














1,098,363 0 
latch free 606,375 552 4.2 


latch free 每 次 等 待 的 时 间 为 552ms， 等 待 cache buffers chains 的 时 间 是 很 不 正常 的 。 一 般 来 
iit, cache buffers chains 等 待 是 由 于 热 块 或 者 热 链 造 成 的 。 以 前 碰 到 的 cache buffers chains 问题 大 
多 数 是 热 块 引起 的 。 不 过 热 链 引起 的 cache buffers chains 门 锁 争 用 也 很 常见 。 

Buffer Nowait 的 比例 是 99.93%， 说 明 热 块 争 用 不 是 特别 厉害 ; 


Number of Cache Buffer Physical Physical Buffer Complete Busy 
P Buffers Hit $ Gets Reads Writes Waits Waits Waits 
D 595,500 94.9 739,848,992 37,571,278 817,573 0 0 619,303 
K 43,670 100.0 84,408,249 55 1,035 0 0 1 


125 分 钟 产 生 62 万 buffer busy waits， 虽 然 说 比较 多 ， 不 过 还 是 可 以 接受 的 ， 毕 竞 是 这 么 大 
的 系统 。 从 cache buffers chains 门 锁 的 情况 来 看 : 











Cache buffers chains kcbgtcr: kslbegin excl 0 227,599 414,454 
cache buffers chains kcbrls: kslbegin 0 199,620 20,593 
cache buffers chains kcbgtcr: fast path 0 73,320 77,189 
cache buffers chains kcbzib: multi-block read: 0 7,494 0 
cache buffers chains kcbzgb: scan from tail. no 0 5,609 0 
cache buffers chains kcbzwb 0 5.367 10,080 
cache buffers chains kcbchg: kslbegin: bufs not 0 4,870 2,647 
cache buffers chains kcbzib: finish free bufs 0 3,206 4,863 
cache buffers chains kcbchg: kslbegin: call CR 0 2,407 1,455 


6H14H 4 机 249 





cache buffers chains kcbgtcr: kslbegin shared 0 1,553 1,204 
cache buffers chains kcbgcur: kslbegin 0 884 910 
cache buffers chains kcbget: pin buffer 0 741 1,344 
cache buffers chains kcbgtcr 0 702 1 
cache buffers chains kcbcge 0 684 59 
cache buffers chains kcbget: exchange rls 0 667 2 
cache buffers chains kcbbic2 0 267 24 
cache buffers chains kcbbxsv 0 235 483 
cache buffers chains kcbnlc 0 179 217 
cache buffers chains kcbget: exchange 0 158 12 





kcbgtcr 和 kcbrls 占 了 绝 大 部 分 。 从 这 些 情况 来 看 ， 热 链 的 可 能 性 比较 大 。 由 于 某 些 热 块 存在 大 量 
的 CR 块 ， 导 致 某 些 链 相 关 的 门 锁 争 用 比较 厉害 。 这 种 情况 下 ， 通 过 调整 DB Cache 的 大 小 可 以 
打 散 hash 链 。 由 于 目前 系统 内 存 比较 紧张 ， 加 大 DB Cache 的 条 件 并 不 具备 , 而 由 于 default 池 的 
命中 率 本 身 就 不 高 (94.9%), 减少 default 池 的 大 小 会 加 大 VO 的 负担 ， 所 以 通过 调整 DB Cache 
的 方法 存在 一 定 风险 。 现在 来 看 , 唯一 的 风险 较 小 的 办 法 是 调整 _DB_BLOCK_HASH_BUCKETS,， 从 
而 打破 热 链 ， 消 除 latch free 等 待 。 

晚上 ,通过 MSN 和 美国 的 John 以 及 澳大利亚 的 Ben 进行 了 沟通 , 谈 了 我 的 想法 。Ben 认为 
可 以 一 试 , 但 是 解决 问题 的 把 握 不 大 。John 认为 我 是 在 异想天开 ,让 我 慎重 , 还 是 要 坚持 优化 部 
分 应 用 。 结 束 和 John 的 谈话 ， 关 闭 电脑 时 已 经 凌晨 2 点 多 了 。 该 好 好 睡 一 觉 了 ， 明 天 一 早 还 要 
赶 到 青岛 去 。 


° spam 


今天 青岛 那 边 出 现 了 cache buffers chains 争 用 的 问题 。 这 个 案例 实际 上 是 在 2004 EREK, 
也 是 老 白 自 认为 比较 得 意 的 一 个 性 能 优化 的 案例 。cache buffers chains 等 待 一 般 来 说 和 应 用 的 关 
系 很 大 ， 当 系统 出 现 了 大 量 的 缓冲 区 获取 时 就 容易 出 现 。 最 好 的 方法 是 通过 应 用 的 调整 来 解决 问 
题 。 而 当时 由 于 开发 商 和 和 集成 商 之 间 存 在 的 了 矛盾， 导致 当时 无 法 很 快 对 SQL 进行 优化 ， 因 此 老 
白 无 奈 之 中 , 才 想 到 去 调整 _DB_BLOCK_HASH_BUCKETS, 打破 热 链 。 其实 这 种 调整 要 基于 对 问题 
分 析 十 分 透彻 的 基础 上 ， 初 入 门 的 DBA 千 万 不 要 轻易 模仿 。 因 为 这 种 参数 一 旦 调整 失败 ， 后 果 
是 十 分 严重 的 。 


E fitil) STATSPACK 报告 分 析 之 DB Cachet 


DB Cache 的 命中 率 在 STATSPACK 头 能 够 很 明确 地 看 到 。 在 STATSPACK 中 也 包含 了 DB 
Cache 的 相关 内 容 : 


Buffer Pool Statistics for DB: HCSP Instance: hcsp Snaps: 111 -121 
-> Standard block size Pools D: default, K: keep, R: recycle 
-> Default Pools for other block sizes: 2k, 4k, 8k, 16k, 32k 









































Free Write Buffer 
Number of Cache Buffer Physical Physical Buffer Complete Busy 
P Buffers Hit $ Gets Reads Writes Waits Waits Waits 
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D 595,500 294.9 739,848,992 37,571,278 817,573 0 0 619,303 
K 43,670 100.0 84,408,249 55 1,035 0 0 1 


实际 上 , 通过 命中 率 只 能 粗略 了 解 DB Cache 的 情况 。 Buffer Pool Statistics 中 包含 了 DB Cache 
中 较为 明细 的 信息 ， 从 中 可 以 了 解 DB Cache 的 实际 情况 。 首 先是 一 个 总 体 情况 ， 每 个 缓冲 池 的 
命中 率 ， 缓 冲 区 获取 的 数量 、 物 理 读 的 数量 、 物 理 写 的 数量 、 空 闻 缓 冲 区 等 待 的 数量 、Write 
Complete Waits 的 数量 、Buffer Busy Waits 的 数量 。 

如 果 系 统 中 使 用 了 多 缓冲 技术 ， 那 么 每 个 缓冲 区 都 会 在 这 个 报告 中 存在 一 行 数据 。D 代表 
default 7th, K 代表 keep gb, R 代表 recycle 池 ， 另 外 还 可 能 出 现 2k. 4k. 8k. 16k, 32k 等 ， 分 别 
代表 水 缓冲 池 。 

在 这 些 指标 里 ， 我 们 要 注意 几 个 指标 。 空 闲 缓冲 区 等 待 (Free Buffer Waits) 用 于 统计 进程 申 
请 DB Cache 时 ， 无 法 直接 分 配 到 空闲 Cache 的 计数 。 对 于 一 个 正常 状态 的 系统 ， 这 个 值 应 该 是 
0。 如 果 这 个 值 非 零 ， 可 能 说 明 DB Cache 不 足 。 写 完成 等 待 【Write Complete Waits) 事件 是 当 某 
个 进程 申请 DB Cache 时 , 发 现 需要 等 待 DBWR 写 入 数据 完成 后 才能 获取 到 空闲 的 缓冲 区 。 这 个 
值 如 果 不 为 零 ， 那 么 说 明 DB Cache 过 小 或 者 DBWR 写 入 过 慢 ， 需 要 增加 DBWR 的 数量 。 

Oracle 9i 开始 引入 了 DB Cache advisory， 用 于 向 DBA 提供 一 个 DB Cache 的 调整 建议 。 下面 
是 一 个 例子 : 


Buffer Pool Advisory for DB: HCSP Instance: hcsp End Snap: 121 
-> Only rows with estimated physical reads »0 are displayed 
-» ordered by Block Size, Buffers For Estimate 

















Size for Size Buffers for Est Physical Estimated 
P Estimate (M) Factr Estimate Read Factor Physical Reads 
K 32 gli 3,970 18,457.61 667,076,603 
K 64 .2 7,940 10,200.68 368,662,788 
K 96 i3 11,910 3,081.00 111,350,322 
K 128 .4 15,880 422.90 15,284,067 
K 160 25 19,850 68.03 2,458,709 
K 192 1 23,820 18.48 667,727 
K 224 .6 27,790 5.34 192,950 
K 256 s 31,760 54 55,505 
K 288 .8 35,730 00 36,14 
K 320 .9 39,700 00 36,14 
K 352 1.0 43,670 00 36,14 
K 384 1. 47,640 00 36,14 
K 416 1.2 51,610 00 36,14 
K 448 1.3 55,580 00 36,14 
K 480 1.4 59,550 00 36,141 
D 480 .1 59,550 5.26 16,018,674,430 
K 512 1:5 63,520 00 36,14 
K 544 125 67,490 00 36,14 
K 576 1.6 71,460 00 36,14 
K 608 127 75,430 00 36,14 
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K 640 1.8 79,400 1.00 36,141 
D 960 2 119,100 3.36 10,245,019,912 
D 1,440 3 178,650 25553 7,705,122,728 
D 1,920 4 238,200 2.09 6,359,203,109 
D 2,400 5 297,750 1.81 5,508,276,852 
D 2,880 6 357,300 1.60 4,884,851,052 
D 3,360 7 416,850 1.43 4,363,040,176 
D 3,840 8 476,400 1.28 3,899,800,284 
D 4,320 9 535,950 1.14 3,462,541,775 
D 4,800 0 595,500 1.00 3,043,964,163 
D 5,280 1 655,050 0.87 2,651,020,663 
D 5,760 2 714,600 0.75 2,291,037,220 
D 6,240 3 774,150 0.65 1,978,723,916 
D 6,720 4 833,700 0.57 1,725,802,559 
D 7,200 5 893,250 0.50 1,522,217,063 
D 7,680 6 952,800 0.45 1,359,329,055 
D 8,160 7 1,012,350 0.40 1,228,618,801 
D 8,640 8 1,071,900 0.37 1,120,457,807 
D 9,120 9 1,131,450 0.34 1,030,471,343 
D 9,600 2.0 1,191,000 0.31 948,853,857 


这 个 表 的 字段 的 含义 如 下 所 示 。 
a P; 缓冲 池 的 名 称 。 
O Size for Estimate (M): 估算 的 缓冲 池 大 小 。 单 位 是 MB. 
O Size Factor; 其 他 估算 值 和 当前 大 小 之 间 的 比例 ， 当 前 缓冲 池 大 小 为 1。 
Q Buffers for Estimate: 估算 的 缓冲 池 的 数量 (单位 为 BLOCK )。 
O Est Physical Read Factor; 使 用 估算 缓冲 池 的 情况 下 ， 产 生 的 物理 读 和 当前 实际 值 的 百 分 
比 。 当 前 缓冲 池 的 物理 读数 量 为 1。 
O Estimated Physical Read: 估算 的 缓冲 池 情 况 下 物理 读 的 大 小 。 
据 此 ， 我 们 可 以 分 析 当 缓冲 池 设 置 成 某 个 大 小 时 ， 对 物理 IO 产生 的 影响 大 概 会 有 多 大 。 这 
对 我 们 在 做 优化 时 ， 判 断 数据 块 缓冲 区 的 大 小 ， 具 有 十 分 好 的 帮助 作用 。 


S fike) STATSPACK 报告 分 析 之 PGA 


Process Global Area， 也 就 是 常 说 的 Program Global Area， 简 称 PGA, ， 是 数据 库 服 务 进程 的 
私有 空间 。 它 包含 全 局 变量 数据 结构 和 控制 信息 , 比如 一 个 游标 的 执行 空间 。 当 某 个 游标 执行 时 ， 
都 需要 在 执行 该 游标 的 服务 进程 的 PGA 里 分 配 一 个 运行 空间 。 

调整 PGA 能 够 提高 数据 库 的 性 能 。 总 的 来 说 ，PGA 空间 越 大 ， 能 够 得 到 越 快 的 性 能 。 拿 排 
序 来 说 ， 如 果 有 足够 的 PGA 排序 区 (sort area) ， 那 么 所 有 的 排序 操作 都 可 以 在 内 存 中 完成 ， 这 
样 的 操作 是 最 优化 的 , PRA Optimal Execs。 如 果 排 序 空 间 不 足 ,， 那么 就 需要 使 用 临时 表 空 间 将 数 
据 存储 到 临时 段 中 。 如 果 通 过 一 次 磁盘 操作 完成 排序 工作 ， 称 为 l-pass Execs。 这 种 方式 由 于 要 
进行 磁盘 操作 ,效率 大 大 降低 。 如 果 通 过 一 次 磁盘 操作 还 不 能 完成 ,需要 进行 多 次 磁盘 交互 ， 那 
么 排序 效率 就 十 分 低下 了 ， 这 种 情况 称 为 m-pass Execs。 
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Oracle 8i 只 能 通过 调整 *_ area_size 参数 来 调整 PGA 的 性 能 。 Oracle 9i 有 了 革命 性 的 改进 ， 
DBA 可 以 通过 设置 PGA_AGGREGATE_TARGET 参数 来 限制 PGA 的 大 小 ， 而 由 Oracle 内 部 的 智能 
算法 来 自动 进行 PGA 各 种 工作 缓冲 区 的 分 配 工作 。 当 WORKAREA_SIZE_POLICY 设置 为 AUTO 时 ， 
PGA 自动 管理 就 会 起 作用 (这 两 个 参数 都 可 以 动态 修改 )。 

要 注意 的 是 ， 在 Oracle9i R2 版 本 中 ，PGA_AGGREGATE_TARGET 只 能 控制 独立 服务 器 模式 的 
服务 进程 的 工作 区 域 。 共 享 服务 器 模式 的 连接 还 是 由 *_area_size 来 控制 。Oracle 10g 可 以 控制 
独立 服务 器 和 共享 服务 器 模式 的 所 有 工作 区 域 。 

一 般 情况 下 ， 如 果 使 用 裸 设 备 ， 那 么 对 于 OLTP 系统 ，PGA_AGGREGATE_TARGET 用 以 下 公 
式 来 分 配 : 




















PGA AGGREGATE TARGET = («Total Physical Memory > * 80%) * 20$ 
T ae 
对 于 OLAP 系统 ， 可 以 按照 下 面 的 公式 计算 : 
PGA AGGREGATE TARGET = («Total Physical Memory > * 80%) * 50% 





要 注意 的 是 ， 以 上 只 是 一 个 建议 的 参数 设置 。 如 果 要 知道 系统 中 设置 什么 样 的 值 比较 合理 ， 
建议 通过 STATSPACK 报告 来 进行 分 析 。 具 体 的 分 析 方法 请 参照 本 章 的 相关 章节 。 通 过 部 分 系统 
视图 也 可 以 对 PGA 的 使 用 情况 进行 分 析 ， 得 到 相应 的 优化 建议 。 

通过 v$pgastat 视图 可 以 得 到 PGA 的 详细 情况 : 


SELECT * FROM v$pgastat; 








NAME VALUE 

aggregate PGA target parameter 524288000 bytes 
aggregate PGA auto target 463435776 bytes 
global memory bound 25600 bytes 
total PGA inuse 9353216 bytes 
total PGA allocated 73516032 bytes 
maximum PGA allocated 698371072 bytes 
total PGA used for auto workareas 0 bytes 

maximum PGA used for auto workareas 560744448 bytes 
total PGA used for manual workareas 0 bytes 

maximum PGA used for manual workareas 0 bytes 

over allocation count 0 bytes 

total bytes processed 4.0072E+10 bytes 
total extra bytes read/written 3.1517E+10 bytes 
cache hit percentage 55.97 percent 


其 中 主要 指标 的 含义 如 下 所 示 。 

O aggregate PGA auto target: Oracle 可 以 用 于 PGA 工作 区 的 空间 。 一 般 比 参数 略 小 。 

Q total PGA used for auto workarea: 系统 实际 使 用 的 PGA 空间 。 

Q maximum PGA used for auto workareas; 上 次 数据 库 启 动 后 PGA 空间 达到 的 最 大 值 。 

a total PGA inuse: 当前 正在 使 用 的 PGA。 可 以 从 v$process 的 pga_used_mem 字段 中 获 
取 。 
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以 下 是 Oracle 9i R2 以 后 的 版 本 具有 的 指标 。 

Q over allocation count: 如 果 PGA AGGREGATE TARGET 太 小 ， 动 态 扩展 PGA 空间 的 次 数 。 
如 果 系 统 的 物理 内 存 足够 ， 那 么 应 该 设置 一 个 足够 大 小 的 PGA AGGREGATE TARGET, {if 
该 统计 值 为 0。 

Q cache hit percentage: PGA 工作 区 使 用 内 存 的 百分比 。 如 果 内 存 足 够 ， 那 么 这 个 值 应 该 接 
近 或 者 等 于 100%。 

v$sql workarea histogram 视图 中 存放 了 PGA 的 使 用 情况 。 通 过 该 视图 可 以 了 解 PGA 

工作 区 域 的 使 用 情况 。 下 面 的 语句 可 以 检查 PGA 的 工作 情况 : 


SELECT LOW OPTIMAL SIZE/1024 low kb, (HIGH OPTIMAL SIZE+1)/1024 high kb, 
optimal executions, onepass executions, multipasses executions 

v$sql workarea histogram 

total executions !- 0; 

HIGH KB OPTIMAL EXECUTIONS ONEPASS EXECUTIONS MULTIPASSES EXECUTIONS 


128 
256 
512 
1024 
2048 
4096 
8192 
16384 
32768 
65536 
131072 
262144 


256 
512 
1024 
2048 
4096 
8192 
16384 
32768 
65536 
131072 
262144 
524288 





156255 
150 
89 
13 
60 
8 
657 
551 
538 
243 
137 
45 
0 

0 

0 

0 
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这 个 视图 可 以 显示 各 种 工作 区 的 使 用 情况 。oPTIMAL_EXECUTIONS 是 不 需要 通过 临时 表 空 
间 交 换 的 操作 次 数 。ONEPASS_EXECUTIONS 是 需要 进行 一 次 临时 表 空 间 交 换 的 操作 次 数 。 
MULTIPASSES EXECUTIONS 
100% 的 操作 都 是 内 存 操作 。 如 果 内 存 不 足 ， 某 些 大 型 操作 是 l-pass 的 也 可 以 接受 。 出 现 m-pass 
的 操作 会 引起 性 能 的 急剧 下 降 。 
v$sql workarea, active 视图 显示 当前 工作 区 的 活动 情况 。 小 于 64KB 的 小 型 排序 不 会 被 





统计 。 通 过 该 视 
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要 进行 多 次 临时 表 空 间 交 换 的 操作 次 数 。 原 则 上 ， 最 佳 选 择 是 








图 可 以 监控 目前 系统 的 工作 区 使 用 情况 。 比 如 : 





SELECT to number(decode(SID, 65535, NULL, SID)) sid, 

operation type OPERATION,trunc(EXPECTED SIZE/1024) ESIZE, 
trunc(ACTUAL MEM USED/1024) MEM, trunc(MAX MEM USED/1024) "MAX MEM", 
NUMBER PASSES PASS, 
FROM v$sql workarea active 
ORDER BY 1,2; 


trunc(TEMPSEG SIZE/1024) TSIZE 
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SID OPERATION ESIZE MEM MAX MEM PASS TSIZE 
8 GROUP BY (SORT) 315 280 904 0 
8 HASH-JOIN 2995 2377 2430 1 20000 
9 GROUP BY (SORT) 34300 22688 22688 0 
11 HASH-JOIN 18044 54482 54482 0 
12 HASH-JOIN 18044 11406 21406 120000 


下 面 介 绍 一 下 这 些 数据 的 具体 含义 。 
SID: 产生 排序 操作 的 会 话 ID, 
OPERATION: 操作 的 类 型 。 
ESIZE: PGA 管理 器 估计 的 本 次 操作 需要 的 总 内 存 数量 (单位 是 KB), 
MEM: 目前 正在 使 用 的 内 存 数量 (单位 是 KB)。 
MAX MEM: 该 会 话 曾 经 使 用 的 最 大 PGA 内 存 数量 (单位 是 KB). 
PASS; 0 代表 内 存 排 序 ，1 代表 1-pass 排序 ，m 代表 m-pass 排序 。 
TSIZE: 转 储 到 临时 表 空 间 的 大 小 (单位 是 KB). 
对 于 Oracle 9i R2 版 本 以 后 的 数据 库 ， 还 提供 了 下 面 两 个 新 视图 。 
D v$pga target advice: 提供 PGA 使 用 的 建议 数据 。 
D v$pga target advice histogram; PGA 建议 直方 图 。 如 果 要 调整 PGA 的 大 小 ， 这 个 
视图 十 分 重要 。 

对 于 一 个 正在 运行 的 实际 系统 ,通过 这 两 个 视图 可 以 了 解 如 何 配置 PGA_AGGREGATE TARGET 
是 比较 合适 的 。 要 使 用 这 两 个 视图 ， 首 先 要 设置 statistics level 为 typical 或 者 a11。 如 
果 该 参数 设置 为 basic， 那 么 这 两 个 视图 不 会 提供 任何 数据 。vspga_target_advice 视图 提供 
PGA AGGREGATE TARGET 和 PGA 命中 率 以 及 PGA Overalloc 的 数量 。 比 如 ; 


SELECT round(PGA TARGET FOR ESTIMATE/1024/1024) target mb, 
ESTD PGA CACHE HIT PERCENTAGE cache hit perc, 
ESTD OVERALLOC COUNT 

FROM v$pga target advice; 

TARGET MB CACHE HIT PERC ESTD OVERALLOC COUNT 
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63 23 367 
125 24 30 
250 30 3 
375 39 0 
500 58 0 
600 59 0 
700 59 0 
800 60 0 
900 60 0 
1000 61 0 
1500 67 0 
2000 76 0 
3000 83 0 
4000 85 0 
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在 设置 PGA AGGREGATE TARGET 上 时， 尽量 选择 物理 内 存 可 以 支撑 的 、 命 中 率 比 较 高 ， 并 且 
ESTD OVERALLOC COUNT 为 0 的 建议 值 。 在 上 面 的 例子 里 ，PGA_AGGREGATE_TARGET 取 值 的 最 
小 值 是 375， 低 于 这 个 值 ，ovERALLOC 是 非 零 的 。 如 果 物 理 内 存 充足 ， 设 置 为 4 000MB 或 者 更 
高 可 以 提高 PGA 的 性 能 。 

v$pga target advice histogram 视图 提供 PGA 使 用 情况 的 直方 图 情况 。 通 过 这 个 统计 
直方 图 ， 可 以 了 解 系统 中 每 个 规模 的 区 域 的 使 用 情况 。 如 果 某 类 较 小 的 工作 区 域 产 生 了 m-pass 
操作 ， 那 么 说 明 PGA 的 设置 偏 小 。 

和 Oracle 8i 比较 ，Oracle 9i 的 工作 区 管理 更 加 灵活 。Oracle 9i 提供 动态 工作 区 管理 的 能 
在 Oracle 8i 下， 分 配 的 工作 区 域 将 不 会 归还 给 操作 系统 ， 会 导致 Oracle 对 物理 内 存 的 过 度 占用 ， 
严重 时 会 导致 系统 产生 换 页 操作 。Oracle 9i 的 工作 区 用 完 后 会 自动 归还 ， 这样 减轻 了 数据 库 服务 
程序 对 物理 内 存 的 占用 。 

如 果 你 不 习惯 通过 SQL 脚本 去 分 析 ， 那 么 完全 可 以 使 用 STATSPACK 报告 。 因 为 这 些 信息 
在 STATSPACK 报告 的 PGA 分 析 章 节 均 有 十 分 明确 的 数据 。 
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为 了 尽快 解决 万 科 长 那 边 的 问题 ， 我 赶 一 大 早 的 飞机 去 青岛 ， 不 过 飞机 有 点 晚点 ， 到 客户 那 
已 经 是 中 午 了 。 我 出 发 前 就 给 万 科 长 发 了 个 邮件 , 说明 我 准备 调整 的 参数 , 希望 他 们 能 够 申请 一 
个 临时 停机 ， 时 间 就 是 中 午 的 12 : 30~ 13 : 30。 这 样 趁 着 中 午时 间 可 以 重启 服务 器 。 在 飞机 上 
我 把 万 科 长 发 来 的 数据 整理 了 一 下 ， 发 现 系统 这 几 天 的 负载 比 前 几 天 要 高 一 些 ， 和 14 日 以 前 的 
数据 相 比 : 
a REDO SIZE 增加 30%，; 
a 逻辑 读 增加 90%; 
口 块 变更 增加 35%; 
a 物理 读 增加 160%; 
a 调用 次 数 增加 35% 5 
a 解析 增加 42%; 
a 硬 解 析 增 加 20%; 
a 排序 增加 48%; 
a 执行 增加 42%. 

到 了 现场 ， 我 检查 了 一 下 系统 ， 虽 然 是 中 午 ，CPU 的 使 用 率 依然 是 100%。 正 是 由 于 业务 量 
的 突然 增加 ， 导 致 对 缓冲 区 的 访问 猛 增 , 最 终 由 于 门 锁 的 争 用 消耗 了 大 量 的 CPU 资源 。 通 过 分 
析 ， 我 发 现 : 


addr=C00000018DB91268 sleeps=2501 
XXXX.CD ROAD 41 25 18317 

XXXX.T PRODTYPE 4 25 1838 

XXXX.CD POS 86 25 1467 

XXXX.CD ROAD FK5 13 32 1048 

XXXX.CD SERVE AREA 116 25 75 
XXXX.WO SERVICE INFO N24 4 15500 56 
addr=C00000018DB90FD8 sleeps=2447 
XXXX.CD_ROAD 41 23 20264 
XXXX.CD_POS 86 23 1805 
XXXX.T_PRODTYPE 4 23 1729 
XXXX.CD_ROAD_FK5 13 30 1044 
XXXX.CD_SERVE_AREA 116 23 639 
XXXX.WO_SERVICE_INFO_N24 4 15498 76 
XXXX.WO_SERVICE_INFO_N24 5 6436 65 
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addr=C00000018DB918D0 sleeps=2098 
XXXX.CD_ROAD 41 30 19120 
XXXX.T_PRODTYPE 4 30 4477 
XXXX.CD_POS 86 30 1284 
XXXX.CD_SERVE_AREA 116 30 174 
XXXX.WO SERVICE INFO N24 5 6443 88 
addr=C00000018DB91120 sleeps=1910 
XXXX.CD_ROAD 41 24 18487 
XXXX.CD_POS 86 24 1471 
XXXX.CD_ROAD_FK5 13 31 1057 
XXXX.T_PRODTYPE 4 24 926 
XXXX.CD_SERVE_AREA 116 24 86 
XXXX.WO SERVICE INFO N22 1 328 57 
XXXX.WO SERVICE INFO 0 968 54 
addr=C00000018DB914F8 sleeps=1753 
XXXX.CD_ROAD 41 27 18505 








XXXX.T PRODTYPE 4 27 3797 
XXXX.CD POS 86 27 1291 
XXXX.CD SERVE AREA 116 27 372 


XXXX.WO SERVICE INFO N24 4 15502 50 
addr=C00000018DB913B0 sleeps=1717 
XXXX.CD_ROAD 41 26 19920 
XXXX.T_PRODTYPE 4 26 4951 
XXXX.CD_POS 86 26 1275 
XXXX.CD_SERVE_AREA 116 26 949 
XXXX.WO SERVICE INFO N24 4 15501 67 
XXXX.WO SERVICE INFO 0 970 45 
XXXX.CD SERVE AREA FK3 12 1 45 
addr-C00000018DB90E90 sleeps-1661 
XXXX.CD ROAD 41 22 20753 

XXXX.T PRODTYPE 4 22 4177 

XXXX.CD POS 86 22 1467 

XXXX.CD SERVE AREA 116 22 1241 
XXXX.CD ROAD FK5 13 29 1049 
XXXX.CD SERVE AREA FK4 45 29 65 
XXXX.WO SERVICE INFO N24 5 6435 42 
addr-C00000018DB91788 sleeps-1503 
XXXX.CD ROAD 41 29 20632 

XXXX.T PRODTYPE 4 29 2537 

XXXX.CD POS 86 29 1281 

XXXX.CD SERVE AREA 116 29 339 
XXXX.WO SERVICE INFO N24 5 6442 47 
XXXX.WO FM REPLACE 0 248 34 
XXXX.WO SERVICE INFO 0 2140 28 
XXXX.WO SERVICE INFO N22 1 333 17 
XXXX.SP TRAN 60 222 17 


从 中 可 以 看 出 ， 热 点 十 分 集中 。 主 要 集中 在 CD_ROAD, T_PRODTYPE 和 CD POS 相关 的 数据 
块 上 。 这 几 张 表 都 是 变更 十 分 频繁 的 ， 存 在 大 量 的 CR 块 。 

离 申 请 的 停机 时 间 越 来 越 近 了 ， 我 已 经 没有 时 间 做 过 多 分 析 了， 并 且 系 统 已 经 基本 不 可 用 ， 
所 以 我 只 能 冒险 先 做 一 下 调整 了 。 我 和 万 科 长 说 只 能 先 试 试 ， 机 会 有 六 成 。 万 科 长 说 没关系 ,就 
是 有 一 成 也 要 试 ， 死 马 当 活 马 医 吧 。 对 于 Oracle 9.2，_DB_BLOCK_HASH_BUCKETS 被 设置 为 大 于 
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2* 缓 冲 区 数量 的 素数 ,我 使 用 Delphi 写 了 一 个 小 程序 , 计算 出 比 当 前 _DB_BLOCK_HASH_BUCKETS 
值 略 大 的 一 个 素数 。 将 该 参数 设置 为 这 个 素数 ， 修 改 后 重启 数据 库 。 正 好 是 下 午 1:30 了 ， 业 务 
高 峰会 出 现在 3 : 00 以 后 , 1 : 30 的 业务 量 也 应 该 相当 于 上 午 9 : 00 左 右 的 情况 。 而 今天 上 午 9 点 多 
的 时 候 系统 几乎 是 不 可 用 的 ， 因 此 这 个 参数 调整 后 有 没有 作用 ， 重 启 业务 后 很 快 就 可 以 看 出 来 。 
应 用 重启 后 ， 我 们 紧张 地 盯 着 OEM 的 监控 界面 。 活 动 会 话 数 量 一 直 维 持 在 150 左右 ， 平 均 事 务 
响应 时 间 在 2s ~3s， 这 已 经 比 上 午 的 超过 7s 的 平均 事务 响应 时 间 好 了 很 多 。 不 过 这 会 不 会 是 由 
于 系统 刚刚 恢复 ， 用 户 还 没有 开始 使 用 有 关 呢 ? 

万 科 长 他 们 在 往 各 地 的 工 贸 公司 打 电 话 咨询 目前 的 系统 情况 , 反馈 回来 的 信息 都 还 不 错 。 打 
JF QQ, 在 QQ 群 上 咨询 ， 反 馈 的 结果 是 比 上 午 好 多 了 ， 现 在 使 用 基本 正常 。 从 监控 界面 上 看 ， 
平均 每 秒 的 事务 数 已 经 超过 40 了 ,这 比 上 午 平均 每 秒 20~30 个 事务 已 经 高 出 很 多 , 活跃 会 话 数 
量 一 直 保 持 在 100~150 之 间 的 正常 范围 。 平 均 事务 响应 时 间 也 在 3s LAA. CPU 使 用 率 也 基本 保 
持 在 60% 左 右 。 我 和 万 科 长 说 干脆 我 们 等 3 : 00 时 看 看 高 峰 期 的 情况 再 去 吃饭 , 反正 现在 大 家 去 
吃饭 也 没什么 胃口 。 于 是 大 家 就 开始 了 焦急 的 等 待 。 

已 经 是 下 午 3 : 10 T, 系统 好 像 一 切 正常 。 万 科 长 他 们 也 已 经 咨询 了 6 个 工 贸 公司 ，40 多 个 
网 点 ， 反 馈 回来 的 结果 是 一 切 正 常 ， 看 样子 调整 起 到 了 效果 。 到 这 个 时 候 大 家 才 感 觉 肚子 有 点 钱 
了 ， 到 现在 为 止 还 没有 吃 中 午饭 。 大 家 一 起 步行 10 多 分 钟 ， 找 到 一 家 韩国 餐馆 ， 点 了 几 个 石 锅 
拌 饭 ， 大 吃 了 起 来 。 吃 饭 时 ， 万 科 长 还 不 停 地 拿 出 手机 看 看 ， 是 不 是 有 电话 ， 我 开玩笑 说 :“ 万 
科 长 ， 你 的 手机 看 样子 坏 了 ， 怎 么 一 个 投诉 电话 都 没有 ? ”看 样子 他 的 心里 还 是 有 一 点 不 踏实 。 
仅仅 调整 了 一 个 参数 ， 就 真 的 能 解决 这 么 严重 的 性 能 问题 吗 ? 

今天 下 午 系统 一 直 工 作 正常 , 到 了 下 午 6 : 00 时 ,系统 负载 明显 下 降 了 。CPU 使 用 率 下 降 到 
30% 了 ， 平 均 事务 响应 时 间 也 提高 到 了 1 秒 多 。 看 样子 今天 的 调整 是 成 功 的 。 我 准备 赶 晚 班 飞机 
回 沈阳 ， 万 科 长 说 别 急 ， 晚 上 给 你 接 风 。 我 说 :“ 万 科 长 ， 你 是 怕 明 天 还 有 事 不 敢 放 我 走 吧 。” 万 
科 长 说 ,“ 两 者 都 有 ， 一 是 表示 感谢 ， 二 是 你 多 竺 一天， 看 看 明天 上 午 的 情况 ， 我 心里 踏实 。” 和 
老 于 联系 了 一 下 , 沈阳 一 切 正常 ,我 晚 回 去 一 天 也 关系 不 大 。 看 样子 晚上 可 以 和 万 科 长 好 好 喝 一 
"à OX AIRE D. 

晚上 和 万 科 长 他 们 在 啤酒 街 吃饭 。 啤 酒 街 就 在 青 啤 旁边 的 一 个 小 巷子 里 , 现在 成 为 一 条 酒吧 
街 ， 每 天 晚上 人 山 人 海 的 。 不 过 到 啤酒 街 喝 酒 的 大 多 数 都 是 外 地 游客 ， 青 岛 本 地 人 喜欢 喝 啤 酒 ， 
不 过 大 多 数 人 都 喜欢 喝 散 装 的 生 啤 ,在 青鸟 街头 到 处 都 能 看 到 卖 生 啤 的 车 , 和 其 他 地 方 不 同 的 是 ， 
青岛 这 边 卖 生 啤 的 是 用 塑料 袋 装 啤酒 。 每 天 傍晚 , 在 青岛 街头 到 处 可 以 看 到 擒 着 一 袋 袋 啤酒 的 人 。 

啤酒 街 的 人 很 多 ， 好 不 容易 找到 一 张 空 桌 子 。 大 家 坐 下 来 ， 点 了 几 个 小 海鲜 ， 要 了 几 扎 青岛 
原 浆 。 今 天 问题 解决 了 ， 所 以 大 家 心情 都 很 放松 。 万 科 长 这 几 天 一 直 如 坐 针 秸 ， 被 工 贸 公司 投诉 
得 抬 不 起 头 来 ， 今 天 一 旦 压力 释放 ， 酒 就 喝 得 很 畅快 。 半 扎 啤酒 下 肚 ， 万 科 长 的 话 也 多 了 起 来 。 
在 他 这 个 位 置 上 ， 确 实 也 是 压力 很 大 。 这 么 大 一 个 系统 ， 全 国 8 000 多 个 客户 端 使 用 ， 而 服务 器 
仅仅 是 一 台 8 颗 CPU, 16GB 内 存 的 RP 7420， 系 统 资 源 的 紧张 可 想 而 知 。 虽 然 开 发 商 已 经 尽 了 
最 大 的 努力 ， 系统 还 是 经 常 出 现 一 些 状况 。 我 今天 下 午 初步 看 了 看 系统 的 情况 ， 感觉 在 底层 架构 
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以 及 物理 数据 字典 设计 方面 还 存在 一 些 问题 ， 这 些 隐 患 不 除 , 今后 还 时 不 时 会 出 现 一 些 问题 。 我 
和 万 科 长 说 了 我 的 担忧 ， 并 说 如 果 万 科 长 能 申请 一 笔 费 用 ， 做 一 个 整体 调 优 ， 可 以 确保 两 年 内 不 
会 出 现 严重 的 性 能 问题 ， 否 则 每 隔 3 个 月 系统 会 出 现 一 次 周期 性 的 性 能 问题 ， 如 果 正 好 碰 到 业务 
量 比较 大 的 时 候 ， 就 很 可 能 出 现 类 似 这 几 天 的 性 能 危机 。 

晚上 回 到 酒店 ,上 网 时 就 收 到 了 Ben 发 来 的 一 个 邮件 。 正 文 什么 都 没有 ， 只 有 一 个 附件 ， 内 
容 是 Rich Niemiec 的 Advanced Tuning with STATSPACK , 这 份 文档 侈 面 地 讲述 了 通过 STATSPACK 
报告 分 析 latch free 问题 的 一 些 基本 方法 。 看 了 一 下 ， 感 觉 收 获 良 多 。 本 来 想 在 网 上 和 Ben 聊 聊 ， 
一 看 表 , 已 经 是 晚上 10 点 多 了 ，Ben 那 边 已 经 是 12 点 多 了 。 不 过 John 这 个 时 候 应 该 在 公司 。 我 
打开 雅虎 通 (Yahoo Messenger) ， 发 现 John 正好 在 线 ， 就 把 今天 调整 的 结果 告诉 了 John, John 
感觉 很 兴奋 。 他 也 研究 过 cache buffers chains 门 锁 争 用 的 问题 ， 以 前 也 尝试 过 调整 BUCKETS 的 数 
量 来 解决 争 用 问题 ， 不 过 没有 成 功 。 这 个 案例 也 是 他 听 说 的 第 一 个 通过 调整 BUCKETS 参数 获得 
成 功 的 例子 ,值得 好 好 总 结 一 下 。 我 把 所 有 资料 都 发 给 他 ， 和 希望 他 有 时 间 再 好 好 研究 一 下 ， 看 看 
能 不 能 从 理论 上 来 更 好 地 解释 这 个 案例 。 我 看 了 一 下 下 午 采 集 的 STATSPACK 报告 , 确实 是 太 神 
奇 了 。 


Load Profile 









































一 ~ Per Second Per Transaction 

Redo size: 258,351.03 5,729.49 

Logical reads: 95,681.57 2,121.95 

Block changes: 1,634.66 36:25 

Physical reads: 5,036,17 111.69 

Physical writes: 186.52 4.14 

User calls: 3,663.65 81.25 

Parses: 614.02 13.02 

Hard parses: 12.09 0.27 

Sorts: 31.67 0.70 

Logons: 0.46 0.01 

Executes: 868.70 19.27 

Transactions: 45.09 

$ Blocks changed per Read: 1.71 Recursive Call $: 26.34 
Rollback per transaction $: 0.47 Rows per Sort: 2659.06 


Instance Efficiency Percentages (Target 1002) 


Buffer Nowait $: 99.71 Redo NoWait % 100.00 

Buffer Hit % 94.76 In-memory Sort $: 99.99 

Library Hit $: 99.40 Soft Parse $: 98.03 

Execute to Parse $: 29.32 Latch Hit $: 99.84 

Parse CPU to Parse Elapsd $: 8.50 $ Non-Parse CPU: 95.29 

Shared Pool Statistics Begin End 

Memory Usage $: 80.86 81.12 
$ SQL with executions>1: 87.88 85.32 


$ Memory for SQL w/exec»1: 98.99 99.16 
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Top 5 Timed Events 


———— % Total 
Event Waits Time (s) Ela Time 
db file sequential read 20,137,988 1,071,848 74.05 
buffer busy waits 2,245,704 193,339 13.36 
db file scattered read 2,139,401 124,182 8.58 
CPU time 44,780 3.09 
io done 917,807 5,398 237 


db file sequential read 等 待 占 了 绝 大 多 数 ， 并 且 每 次 等 待 时间 高 达 50ms, LO 又 出 现 了 一 定 的 
瓶颈 ， 但 是 CPU 使 用 率 明 显 下 降 了 ,平均 事务 响应 时 间 也 下 降 到 2 f» T. VO 问题 是 这 个 系统 
的 老 问 题 ， 实 际 上 这 个 案例 的 目的 是 解决 CPU 瓶颈 问题 。latch free 和 CPU 瓶颈 是 互 为 影响 的 ， 
由 于 latch free， 门 锁 获 取消 耗 了 大 量 的 CPU 资源 ， 从 而 导致 CPU 出 现 瓶 颈 ， 反 过 来 CPU 不 足 
更 加 加 剧 了 门 锁 的 性 能 问题 。 当 CPU 出 现 瓶颈 时 , VO 问题 不 明显 了 , 甚至 VO 性 能 恢复 了 正常 。 
通过 恶化 VO 来 换取 CPU 负载 的 减轻 是 调 优 时 经 常 使 用 的 技术 。 因 此 我 在 确定 调整 策略 时 ， 坚 
持 不 加 大 DB Cache。 因 为 加 大 DB Cache 会 增加 CPU 消耗 ， 对 于 解决 目前 的 问题 不 利 。 因 为 给 
我 做 优化 的 机 会 只 有 一 次 ， 所 以 我 的 优化 目的 不 是 使 系统 达到 最 优化 ， 而 是 解决 目前 的 问题 ， 使 
系统 恢复 正常 运行 状态 。 只 要 客户 能 够 接受 就 可 以 了 ， 而 不 是 去 解决 所 有 的 问题 。 因 为 优化 是 一 
个 十 分 复杂 的 系统 工程 , 就 像 解 多 元 多 次 方程 组 , 变 元 之 多 , 结果 之 不 确定 是 很 多 人 想象 不 到 的 。 
因此 ,每 次 优化 我 都 会 以 目标 为 导向 ， 而 不 是 以 技术 为 导向 。 一 旦 实现 目标 就 收 手 ， 而 不 会 去 做 
画蛇添足 的 事情 。 


X spa 


今天 老 白 通过 调整 隐 含 参数 达到 了 优化 目的 。 不 过 在 实际 工作 中 隐 含 参数 的 使 用 要 十 分 谨 
慎 。 隐 含 参数 一 般 用 于 改变 数据 库 的 一 些 工作 特性 。 在 Oracle 官方 发 布 的 文档 中 ,很 少 有 隐 含 参 
数 的 介绍 。 在 Metalink 上 的 一 些 仅 限 内 部 阅读 (Oracle 内 部 使 用 ) 的 文档 中 ,包含 了 对 隐 含 参数 
使 用 的 描述 。 在 Oracle 粉丝 网 上 有 一 个 专门 的 栏目 用 于 大 家 发 布 隐 含 参数 相关 的 文档 , 大 家 也 可 
以 去 那里 查阅 。 通 过 下 列 脚本 ， 可 以 查询 某 个 隐 含 参数 的 取 值 : 


set line 132 
col "session value" format a40 truncate 
col "parameter" format a40 truncate 















































SELECT 
a.ksppinm "Parameter", 
a.ksppdesc "Description", 
b.ksppstvl "Session Value" 
c.ksppstvl "Instance Value" 
FROM 
x$ksppi a, 
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x$ksppcv b, 
x$ksppsv c 
WHERE 
a.indx - b.indx 
AND 
a.indx - c.indx 
AND 
a.ksppinm - lower('&1'); 





要 注意 的 是 , 因为 隐 含 参数 的 改变 可 能 影响 到 数据 库 的 运行 状态 , 所 以 调整 隐 含 参数 一 定 要 
经 过 资深 入 员 的 确认 或 者 在 Metalink 上 开 一 个 服务 请 求 ， 向 Oracle GCS 的 技术 人 员 咨 询 。 


车 人 优化 小 技巧 ) 如 何 优化 门 锁 


门 锁 竞 争 是 数据 库 优 化 工作 中 经 常 磁 到 的 问题 ,会 极 大 影响 数据 库 系 统 的 性 能 。 门 锁 竞 争 的 
主要 表现 为 系统 响应 时 间 急 剧 增加 ， 系 统 CPU 使 用 率 大 幅度 增加 ， 严 重 时 会 出 现 CPU 长 时 间 处 
于 100% 的 状态 。 通 过 STATSPACK 报告 可 以 看 出 ，latch free 等 待 成 为 Top 5 等 待 中 的 一 个 。 

门 锁 竞 争 会 导致 大 量 的 系统 等 待 。 由 于 门 锁 的 机 制 是 重 试 加 休眠 的 方式 ,所 以 如 果 存 在 大 量 
门 锁 竞 争 ， 系 统 性 能 将 急剧 下 降 ， 并 且 会 导致 系统 出 现 十 分 恶劣 的 性 能 问题 。 解 决 门 锁 竞 争 问题 
是 数据 库 系 统 调 优 中 最 具 挑 战 性 的 工作 。 门 锁 是 一 种 开销 比较 小 的 短 时 间 锁 定 资源 的 方式 ,， 通 过 
设置 锁定 位 来 实现 。latch free 等 待 的 含义 是 当 某 个 操作 需要 获得 某 个 资源 时 其 他 会 话 已 经 锁定 了 
该 资产， 导致 latch free 等 待 。 门 锁 竞 争 问题 分 为 独立 门 锁 竞争 和 系统 级 门 锁 竞 争 。 独 立 门 锁 竞 
争 是 由 于 对 每 个 资源 的 竞争 访问 引起 的 , 而 系统 级 门 锁 竞争 是 由 于 系统 中 大 量 访问 热点 资源 引起 
的 。 对 于 这 两 种 竞争 ， 有 不 同 的 处 理 方 法 。 

要 讨论 独立 门 锁 竞 争 , 首先 要 介绍 几 个 关键 参数 (为 了 便于 下 面 的 讨论 ， 对 每 个 参数 都 起 了 
别名 )。 

O 门 锁 地 址 : 这 里 指 Pl 参数 ， 类 型 为 RAW。 (HERE: 对 于 32 位 系统 和 64 位 系统 ， 以 及 不 

同 的 Oracle 版 本 ， 长 度 略 有 不 同 。) 

O Hz: v$latchname 中 的 Latch# 值 。 这 里 指 P2 参数 。 

O tries: 为 了 获取 该 门 锁 ， 进 行 了 多 少 次 尝试 。 这 里 指 P3 参数 。 

a 等 待 时 间 : 如 果 一 个 会 话 等 待 一 个 门 锁 ， 那 么 首先 进行 短暂 的 休眠 ， 然 后 重新 测试 这 个 
门 锁 ， 如 果 还 是 没有 获取 该 门 锁 ， 那 么 增加 P3 ， 会 话 重新 进入 等 待 。 通 过 门 锁 地 址 可 以 
找到 该 门 锁 的 相关 情况 : 


SELECT name, 'Child '||child#, gets, misses, sleeps 
FROM v$latch children 

WHERE addr-'&P1' 

UNION 

SELECT name, null, gets, misses, sleeps 
FROM v$latch 

WHERE addr-'&P1'; 


通过 门 锁 号 可 以 直接 从 vSlatchname 中 查找 门 锁 的 信息 : 
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SELECT * FROM v$latchname 
WHERE latch# = &P2; 


门 锁 等 待 是 十 分 短 的 等 待 操作 。 如 果 系 统 中 的 门 锁 等 待 时 间 比 较 长 ,那么 就 需要 查 请 哪些 门 
锁 的 竞争 十 分 激烈 。 使 用 STATSPACK 报告 或 者 BSTAT/ESTAT 报告 中 的 相关 信息 ， 可 以 查找 门 
锁 等 待 的 情况 。 生 成 这 些 报告 信息 的 基础 是 v$latch。 下 面 的 语句 可 以 查找 竞争 比较 多 的 门 锁 : 


SELECT latch#, name, gets, misses, sleeps 
FROM v$latch 
WHERE sleeps>0 

ORDER BY sleeps DESC; 


在 这 个 列表 的 最 前 面 列 出 的 就 是 情况 最 糟糕 的 门 锁 。 通 过 上 面 的 语句 进行 进一步 的 分 析 ， 可 以 进 
一 步 定 位 门 锁 竞争 。 下 一 步 的 定位 需要 使 用 另外 一 个 视图 v$latch children (这 个 视图 是 
Oracle 7.3 版 本 以 后 才 有 的 ): 


SELECT addr, latch#, gets, misses, sleeps 
FROM v$latch_children 
WHERE sleeps>0 
and latch# = &LATCH_NUMBER 

ORDER BY sleeps ; 


这 里 的 LATCH_NUMBER 指 的 是 上 面 查询 中 找到 的 latch#。 这 里 列 出 第 一 个 查询 中 门 锁 的 子 门 锁 
的 情况 。 如 果 这 个 查询 没有 返回 值 ， 那 么 说 明 这 个 门 锁 没有 子 门 锁 。 

如 果 返 回 的 结果 有 多 行 ， 那么 最 重要 的 是 找 出 sleeps 比较 大 的 门 锁 , 或 者 找 出 占 sleeps 等 待 最 
大 比例 的 几 个 门 锁 。 找 到 这 些 门 锁 后 ,可 以 通过 查询 v$latch_holger 来 找到 这 些 门 锁 的 持 有 者 。 

门 锁 竞争 的 问题 解决 起 来 十 分 复杂 , 没有 绝对 的 方法 可 以 定位 和 解决 门 锁 竞争 的 问题 。 如 果 
找 不 到 特定 的 门 锁 ， 所 有 的 门 锁 都 存在 等 待 问题 ， 那 么 需要 检查 CPU 资源 是 否 充足 。 如 果 
STATSPACK 报告 中 ，latch free 处 于 主要 事件 的 前 儿 位 ， 那 么 说 明 系 统 存在 门 锁 竞 争 问 题 。 在 报 
告 中 , 任何 Miss 或 者 No Wait Miss 超过 1% 的 门 锁 都 需要 我 们 详细 分 析 ， 看 看 是 否 存在 问题 。 对 
于 一 些 比 较 常 见 的 门 锁 问题 ， 我 们 将 在 下 面 详细 讨论 。 

1. 共享 池 

大 多 数 共享 池 的 操作 都 需要 使 用 共享 池 门 锁 ， 比 如 说 共享 池 中 对 象 的 分 配 、 释 放 和 查找 。 过 
多 地 使 用 文字 化 的 SQL 语句 【没有 使 用 绑 定 变量 ) 会 导致 SQL 分 析 数 量 的 增长 ， 而 SQL 分析 需 
要 多 次 使 用 共享 池 门 锁 ， 从 而 导致 共享 池 门 锁 等 待 。 另 外 ， 如 果 共 享 池 的 容量 不 足 ， 也 会 导致 共 
享 池 中 的 对 象 产生 抖动 现象 ， 从 而 加 剧 该 门 锁 的 竞争 。 

2. 库 缓存 

从 Oracle 7.2 开始 ， 库 缓存 门 锁 包 含 子 门 锁 。 对 库 缓 存 的 分 配 、 释 放 和 查找 等 操作 需要 使 用 
该 门 锁 。 大 量 使 用 文字 化 的 SQL 或 者 共享 地 不 足 会 导致 库 缓存 的 变更 加 剧 ， 甚 至 产生 库 缓 存 的 
抖动 ， 从 而 加 剧 该 门 锁 的 竞争 。 

3. 缓存 缓冲 区 LRU 链 

缓存 缓冲 区 LRU 链 门 锁 是 管理 DB Cache 的 LRU 队列 。 从 Oracle 7.3 开始 , 数据 库 支 持 多 个 
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缓存 缓冲 区 LRU 链 门 锁 。 通 过 调整 DB BLOCK LRU LaTCHES 参数 ， 可 以 调整 这 个 门 锁 的 数量 。 
要 注意 的 是 ,每 个 数据 库 的 版 本 对 于 调整 该 参数 的 规则 都 各 不 相同 ,因此 在 调整 这 个 参数 时 要 参 
考 相关 版 本 的 参考 手册 。 

这 个 门 锁 的 主要 竞争 原因 是 过 多 的 全 表 扫 描 或 者 过 多 地 扫描 选择 性 差 的 索引 。 对 于 Oracle 7 
或 者 Oracle 8.0, 如 果 没 有 使 用 soRr. DIRECT. WRITES, 大 量 的 排序 操作 也 会 导致 该 门 锁 的 竞争 。 

4. 缓存 缓冲 区 链 

产生 缓存 缓冲 区 链 的 竞争 的 原因 是 热 块 冲突 或 者 热 链 冲突 。 热 块 冲突 很 多 DBA 都 经 常 遇 到 ， 
就 是 多 个 会 话 同 时 访问 一 个 块 ， 导 致 竞争 。 热 块 竞争 的 原因 比较 复杂 ， 下 面 简要 列 出 几 个 。 
DJIO 性 能 问题 会 导致 热 块 冲突 。 
a 应 用 设计 缺陷 会 导致 过 多 地 对 同一 数据 进行 并 发 访问 ， 从 而 导致 热 块 冲 突 。 对 于 此 类 问 
题 ， 使 用 较 小 的 块 大 小 或 者 使 用 散 列 分 区 等 技术 可 以 减少 热 块 冲突 。 
a 某 些 通过 序列 号 产生 的 主 健 或 者 索引 会 导致 对 索引 访问 的 热 块 冲突 。 对 于 此 类 问题 ， 使 

用 反 转 键 索 引 可 以 解决 热 块 冲突 问题 。 

缓存 缓冲 区 链 冲 突 的 另外 一 种 情况 是 热 链 冲突 。 也 就 是 说 ， 对 同一 个 hash 链 的 并 发 访问 量 
过 大 ， 导 致 该 门 锁 竞 争 。 从 Oracle 8i 开始 ， 支 持 很 大 的 DB Cache， 因 此 热 链 冲突 也 比较 容易 发 
生 。 如 果 是 热 链 冲突 ， 调 整 _DB_BLOCK_HASH BUCKETS (这 里 以 Oracle 9i 为 例 ，Oracle 的 各 个 
版 本 略 有 不 同 ) 可 以 改变 散 列 链 的 分 布 ， 有 助 于 解决 缓存 缓冲 区 链 等 待 问题 。 

对 于 Oracle8， 下 面 的 SQL 可 以 查找 到 产生 该 门 锁 冲 突 的 数据 块 : 


SELECT File# , dbablk, class, state 
FROM x$bh 
WHERE hladdr-'&ADDR OF CHILD LATCH' ; 


对 于 Oracle 7, x$bh 的 结构 略 有 不 同 ， 需 要 使 用 如 下 SQL 查询 : 


SELECT dbafil FILE# , dbablk, class, state 
FROM x$bh 
WHERE hladdr-'&ADDR OF CHILD LATCH'; 


如 果 查 询 结果 只 有 几 条 记录 ， 说 明 这 几 个 数据 块 是 十 分 热 的 热 块 。 通 过 反复 观察 x$bh, FT 
以 定位 比较 热 的 块 。 对 于 Oracle 8i 数据库 来 说 ， 由 于 cache buffer chains 门 锁 的 数量 较 少 ， 如 果 
DB Cache 比较 大 ， 那 么 一 个 门 锁 管 理 的 缓冲 区 数量 较 大 。 这 些 缓冲 区 如 果 比 较 “ 热 "， 那 么 也 会 
出 现 较 严重 的 门 锁 竞 争 ， 此 时 调整 门 锁 的 数量 可 以 解决 部 分 问题 。 

下 面 的 SQL 语句 可 以 帮助 DBA 检查 门 锁 的 情况 : 


SELECT "WHERE", SLEEP COUNT, WTR SLP COUNT, LONGHOLD COUNT 
FROM v$latch misses 
WHERE parent name-'&ADDR OF PROBLEM LATCH' 
ORDER BY ; 


门 锁 竞争 会 导致 CPU 资源 被 过 度 消耗 ， 从 而 导致 系统 性 能 严重 下 降 。 反 过 来 ， 如 果 CPU 资 
WAVE, 那么 也 有 可 能 造成 较为 严重 的 门 锁 竞争 。 在 实际 工作 中 , 需要 我 们 识别 出 到 底 哪 个 是 因 
哪个 是 果 。 
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昨天 刚 调 整 了 系统 ， 所 以 今天 一 大 早 我 就 起 来 了 ， 这 也 是 我 多 年 给 客户 服务 养 成 的 习惯 。 一 
般 来 说 实施 调整 后 的 第 二 天 ,我 会 在 客户 上 班 前 赶 到 现场 ， 以 防止 出 现 异 常 现象 。 一 大 早 打 了 辆 
E, 拿 着 行李 到 老 万 那里 去 看 看 ， 如 果 现 场 没什么 问题 ,我 就 准备 直接 去 机 场 了 。 走 进 维护 部 的 
HAE, 发 现 气 氛 比 昨天 这 时 候 要 轻松 得 多 。 万 科 长 正在 打 电话 ， 看 到 我 进来 , 做 了 个 表示 歉意 
的 手势 。 宋 工 连忙 招呼 我 坐 下 ,顺手 从 旁边 的 纸箱 里 拿 出 一 瓶 矿泉 水 递 了 过 来 。 宋 工 是 万 科 长 手 
下 的 DBA， 在 这 个 项 目 中 我 们 已 经 配合 多 次 ， 是 个 工作 十 分 认真 的 年 轻 人 。 

我 拿 出 笔记 本 电脑 ， 连 上 系统 ， 使 用 OEM 查看 了 一 下 系统 状态 。 现 在 是 早上 8 : 30， 各 地 
的 工 贸 公司 和 服务 网 点 陆续 上 班 了 ， 不 过 业务 高 峰 要 9 : 00 以 后 才 会 到 来 。 从 现在 的 情况 看 ， 数 
据 库 运行 十 分 正常 , 平均 事务 响应 时 间 稳 定 在 2~3 秒 之 间 , 看 样子 昨天 的 调整 确实 起 到 了 作用 。 
万 科 长 打 了 半天 电话 才 走 过 来 , 说 :“ 这 么 急 着 走 啊 ,休息 一 天 ,晚上 一 起 喝 点 ,给 你 庆功 。” 我 
说 :“ 下 回 吧 ， 沈 阳 那 边 事情 也 很 急 ， 今 天 必须 赶 回去 。 看 样子 这 边 不 会 有 什么 问题 了 ， 你 请 我 
喝酒 是 怕 系 统 有 什么 反复 吧 。” 万 科 长 连忙 解释， 我 说 这 只 是 玩笑 而 已 ， 不 要 当真 ， 确 实 沈阳 那 
边 事情 很 紧急 ， 必 须 马 上 回去 。 

9:30 了 ， 系 统 的 状态 一 直 维 持 在 刚才 那 种 情况 ，latch free 等 待 没 有 再 次 出 现 ， 看 样子 系统 
真 的 没 问 题 了 。 和 万 科 长 寒 蜡 了 几 句 后 ， 我 就 告辞 了 。 如 果 运 气 好 ， 我 还 赶 得 上 中 午 那 班 飞机 。 
看 样子 今天 运气 也 不 错 ， 和 万 科 长 道别 后 一 出 工 贸 公司 的 大 门 ， 就 看 到 一 辆 出 租车 正 准备 掉头 。 
上 了 出 租车 ,马上 打 电 话 订 机 票 。 青 岛 到 沈阳 的 航班 不 多 ， 如 果 赶 不 上 中 午 的 航班 ， 就 只 能 晚上 
走 了 。 订 好 机 票 后 ， 才 发 现 是 个 老司 机 ， 大 概 有 60 多 岁 了 ， 师 傅 虽 然 不 年 轻 了 ， 不 过 车 开 得 发 
快 。 我 说 :“ 师 倩 ， 不 着 急 ， 我 不 赶 时 间 。” 师 傅 说 :“ 你 是 不 赶 时 间 啊 ， 我 还 要 赶 时 间 挣 钱 呢 。” 
山东 这 地 方 人 豪爽 ， 火 气 也 旺 ， 碰 到 这 么 个 老师 倩 ， 也 真 没 办 法 。 师 傅 开 得 够 快 ， 不 到 10 : 00 
就 到 机 场 了 。 办 理 登 机 牌 时 ,工作 人 员 告 诉 我 飞机 晚点 ,具体 晚 多 少 现 在 还 不 清楚 ,刚才 的 好 心 
情 顿 时 烟消云散 了 , 今天 可 能 又 要 在 机 场 吃 午饭 了 。 还 好 有 贵宾 卡 ， 只 好 在 贵宾 室 里 找 个 有 网 线 
和 电源 线 的 位 置 ， 坐 下 来 上 网 。 

dia SPA, 随手 又 拿 了 几 块 饼干 ， 刚刚 坐 下 ， 电 话 就 响 了 。 电 话 是 一 个 客户 打 过 来 的 , 说 是 
磁 到 一 个 很 奇怪 的 问题 。 在 一 张 上 千 万 条 记录 的 大 表 里 ， 做 一 个 SELECT * FROM «TAB NAME» 
WHERE ROWNUM<100， 居 然 10 多 秒 钟 才 出 来 。 我 问 他 这 张 表 是 不 是 碎片 很 厉害 ， 他 说 不 可 能 
碎片 ， 因 为 这 张 表 是 昨天 晚上 才 IMP 进去 的 ， 昨 天 还 没 问 题 ， 今 天 就 出 问题 了 。 而 且 这 张 是 话 
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单 表 ， 不 可 能 会 做 删除 操作 的 ， 不 会 有 碎片 。 
我 让 他 马上 做 个 10046 的 Trace 发 过 来 。10 分 钟 后 ， 他 通过 QQ 把 Trace 文件 发 过 来 了 : 


SELE 
FROM 


CT * 


ttt where rownum<100 


call 


Pars 





e 


Fetch 


count 


cpu elapsed 
0.14 D.17 
0.00 0.00 
3:71 5.86 
3.85 6.03 














disk query current rows 
44 198 0 0 

0 0 0 0 
67489 68340 0 99 
67533 68538 0 99 


从 上 面 看 ， 确 实 产生 了 67533 个 物理 读 和 68 538 个 逻辑 读 ， 执 行 时 间 为 6.03s。 从 等 待 事件 
来 看 : 





=206418 tim=1422207486810 
nam-'SQL*Net more data to client' ela- 203 driver id-1650815232 #bytes=2002 
=206418 tim-1422207487071 
nam-'SQL*Net more data to clien 
-206418 tim-1422207487175 

nam-'db file scattered read' 














8 tim-1 
nam-'db 
8 tim-1 
nam-'db 
8 tim-1 
nam-'db 
8 tim-1 
nam-'db 
8 tim-1 
nam-'db 
8 tim-1 
nam-'db 
8 tim-1 
nam-'db 
8 tim-1 
nam-'db 
8 tim-1 
nam= ' db 
8 tim-1 
nam= ' db 
8 tim-1 
nam= ' db 
8 tim-1 
nam= ' db 
8 tim-1 
nam= ' db 


BINDS #39: 
EXEC 

WAIT 

obj 

WAIT 439: 
p3=0 obj 
WAIT #39: 
p3=0 obj 
WAIT #39: 
obj#=20641 
WAIT #39: 
obj #=20641 
WAIT #39: 
obj #=20641 
WAIT #39: 
obj #=20641 
WAIT #39: 
obj #=20641 
WAIT #39: 
obj #=20641 
WAIT #39: 
obj#=20641 
WAIT #39: 
obj #=20641 
WAIT #39: 
obj #=20641 
WAIT #39: 
obj #=20641 
WAIT #39: 
obj #=20641 
WAIT #39: 
obj #=20641 
WAIT #39: 
obj#=20641 
WAIT #39: 
obj#=2064 



























































18 tim=1 


422 
fi 
422 
fi 
422 
fi 
422 
fi 
422 
fi 
422 
fi 
422 
fi 
422 
fi 
422 
fi 
422 
fi 
422 
fi 
422 
fi 
422 
fi 
422 





207488208 
le scattered read' 
207489579 
le scattered read' 
207492091 
le scattered read' 
207493135 
le scattered read' 
207494016 
le scattered read' 
207496049 
le scattered read' 
207497350 
le scattered read' 
207498049 
le scattered read' 
207499416 
le scattered read' 
207501237 
le scattered read' 
207504191 
le scattered read' 
207505141 
le scattered read' 
207507029 
le scattered read' 
207507787 











el 


39:c=0,e=88,p=0,cr=0,cu=0,mis=0,r=0,dep=0, og=1, tim=1422207486718 
39: nam='SQL*Net message to client' 


ela- 7 driver id-1650815232 #bytes=1 p3=0 


la- 2121 file#=1 


la- 1666 file#=1 


la- 1026 file#=1 


la- 1075 file#=1 


la- 1649 file#=1 





la- 2768 file#=1 


la- 1588 file#=1 








t' ela- 66 driver id-1650815232 #bytes=2020 


la- 515 file#=146 block#=92900 blocks=5 


la= 918 file#=146 block#=92905 blocks=8 


46 block#=92914 blocks=7 


la= 617 file#=146 block#=92921 blocks=8 


la- 493 file#=146 block#=92930 blocks-7 


47 block#=897417 blocks=8 


47 block#=897426 blocks=7 


la= 378 file#=147 block#=897433 blocks=8 


47 block#=897442 blocks=7 


47 block#=897449 blocks=3 





47 block#=897453 blocks=4 


la= 653 file#=147 block#=897458 blocks=7 


47 block#=897465 blocks=8 





la- 460 file#=147 block#=897474 blocks=7 


266 Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





WAIT #39: nam='db file scattered read' ela- 608 file#=147 block#=897481 blocks=8 
obj #=206418 tim-1422207508697 
WAIT #39: nam='db file scattered read' ela= 564 file#=147 block#=897490 blocks=7 
obj #=206418 tim-1422207509571 
WAIT #39: nam='db file scattered read' ela= 832 file#=147 block#=897497 blocks=8 
obj #=206418 tim-1422207510668 
WAIT #39: nam='db file scattered read' ela= 846 file#=148 block#=102411 blocks=16 
obj #=206418 tim-1422207512030 
WAIT #39: nam='db file scattered read' ela= 4872 file#=148 block#=102427 blocks=16 
obj #=206418 tim-1422207517488 
WAIT #39: nam='db file scattered read' ela= 1624 file#=148 block#=102443 blocks=16 
obj #=206418 tim=1422207520062 


确实 存在 大 量 的 db file scattered read。 这 更 加 坚信 了 我 的 观点 ， 表 里 存在 大 量 的 碎片 。 找 第 一 个 
db file scattered read 的 参数 file#=146 block#=92900, 让 客户 执行 ALTER system dump data- 
file 146 block min 92900 block max 92904， 获 得 的 结果 如 下 : 





















































data block dump,data header at 0x6000000000208e64 


tsiz: OÜxlf98 

hsiz: 0x4c 

pbl: 0x6000000000208e64 
bdba: 0x24816ae4 











76543210 
flag--------- 
ntab=1 
nrow=29 
frre=0 
fsbo-0x4c 
fseo=0xf7 
avsp=0x1f4c 
tosp=0x1lf4c 
Oxe:pti[0 nrow=29 offs=0 
0x12:pri[0 sfll-1 
0x14:pri[l sfllz2 
0x16:pri[2 sf11-3 
0x18:pri[3 sfll-4 
Oxla:pri[4 sfll=5 
Oxlc:pri[5 sfll=6 
Oxle:pri[6 sfllz7 
0x20:pri[7 sf11=8 
0x22:pri[8 sfllz9 
0x24:pri[9 sf11=10 
0x26:pri[10 sflis11 
0x28:pri[11 sf11=12 
Ox2a:pri[12 sf11=13 
Ox2c:pri[13 sfll-14 
Ox2e:pri[14 sf11=15 
0x30:pri[15 sfll-16 
0x32:pri[16 sf11=17 
0x34:pri[17 sf11=18 
0x36:pri[18 sf11=19 
0x38:pri[19 sf11-20 
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Ox3a:pri[20 SELI 
Ox3c:pri[21 sfll 
Ox3e:pri[22 sfll 
0x40:pri[23 sfll 
0x42:pri[24 sfll 
0Ox44:pri[25 SELI 
0x46:pri[26 SELL 
0x48:pri[27 sfll 
Ox4a:pri[28 sfll 
block row dump: 

end of block dump 








里 面 全 部 是 空 记 录 。 建 议 客户 做 一 个 ALTER TABLE <table> MOVE; 表 重组 后 ， 发 现 原来 12GB 
的 表 只 剩 下 800MB 了 。 再 执行 这 个 SQL， 只 有 12 个 缓冲 区 获取 了 : 


Statistics 


1 recursive calls 
0 db block gets 
12 consistent gets 
1 physical reads 

0 redo size 


18921 bytes 
558 bytes 


sent via SQL*Net to client 
received via SQL*Net from client 


8 SQL*Net roundtrips to/from client 


0 sorts 
0 sorts 


(memory) 
(disk) 


99 rows processed 
解决 问题 后 , 我 又 和 客户 聊 了 儿 句 ,主要 是 关于 碎片 产生 的 原因 的 。 我 觉得 如 果真 的 按照 客 
户 所 说 ， 是 不 可 能 存在 碎片 的 ， 肯 定 是 这 张 表 做 了 大 量 删除 操作 。 最 后 ， 客 户 终于 承认 ， 这 张 表 
刚刚 被 导入 ,没有 做 任何 删除 操作 也 是 听 他 手下 的 一 个 程序 员 说 的 ， 他 也 被 错误 的 信息 蒙 项 了 。 
在 网 上 帮 客 户 解决 了 几 个 小 问题 ， 不 知 不 觉 过 去 了 3 个 多 小 时 。 在 贵宾 室 吃 过 午饭 后 , 广播 














里 发 出 了 登 机 通知 。 沈 B 








， 我 又 回来 了 ， 只 是 不 知道 下 飞机 后 要 面 对 的 又 将 是 什么 。 





opm 


今天 老 白 处 理 这 个 案例 时 没有 走 太 多 弯路 ,主要 原因 是 老 白 对 相关 理论 有 足够 的 了 解 。 客 户 
实际 上 提供 了 一 个 错误 的 信息 ， 如 果 这 时 候 你 对 表 的 内 部 存储 原理 、 表 碎片 产生 的 原因 、 全 表 扫 
描 的 基本 原理 等 理论 知识 不 了 解 ， 那 么 这 个 问题 可 能 会 困扰 你 半天 。 














在 分 析 问 题 时 ， 如果 你 对 主要 的 理论 掌握 得 十 分 充分 ， 那么 除了 根据 经 验 分 析 问 题 外 , 还 可 





以 通过 理论 去 进行 分 析 。 以 这 个 案例 为 例 ， 首 先 这 个 SQL 是 对 全 表 进行 扫描 ， 因 此 会 从 表 的 第 
一 块 数据 开始 扫描 ， 直 到 找到 前 99 条 记录 为 止 。 这 个 数据 库 的 一 个 块 大 小 为 SKB ， 一 个 块 可 以 
存放 的 数据 大 概 会 有 几 十 条 ， 那 么 100 条 记录 只 需要 扫描 几 个 数据 块 就 可 以 完成 了 。 如 果 SQL* 


Plus 的 默认 数组 大 小 是 5， 


那么 顶 多 二 三 十 个 缓冲 区 获取 就 应 该 能 够 完成 ,而 实际 上 产生 了 68538 


个 缓冲 区 获取 。 这 从 理论 上 只 有 一 个 解释 , 就 是 这 张 表 的 前 面部 分 都 是 碎片 , 也 就 是 格式 化 过 的 ， 
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不 过 没有 任何 数据 的 块 。 所 以 老 白 要 求 客户 马上 转 储 几 个 数据 块 出 来 看 看 。 通 过 转 储 的 结果 ， 很 


容易 发 现 这 些 数据 块 都 是 空 的 。 


E nenas) 如 何 转 储 数据 块 
通过 转 储 数 据 块 来 分 析 数据 结构 是 DBA 经 常会 用 到 的 手段 。 


今天 的 例子 就 是 通过 转 储 数据 


块 发 现 表 碎片 的 。 现 在 通过 一 个 实际 的 案例 介绍 一 下 如 何 转 储 数据 块 , 并且 简单 地 介绍 一 下 数据 





块 的 内 部 结构 。 


这 里 介绍 一 下 type: 0x06-trans data 数据 块 的 结构 (本文 涉及 的 数据 库 版 本 为 Oracle 


10.2.0.1)。 下 面 是 一 个 块 的 逻辑 结构 : 


buffer tsn: 4 rdba: 0x0100a714 (4/42772) 

scn: 0x0000.0025486e seq: 0x02 flg: 0x04 tail: 
frmt: 0x02 chkval: Oxddfl type: 0x06-trans data 
Block header dump: 0x0100a714 

Object id on Block? Y 


0x486e0 


602 


seg/obj: 0x 
brn: 0 bdba 
inc: 0 exfl 


Itl Xid Uba 
0x01 Oxffff 
0x02 0x0000 
0x03 0x0000 


cc5c csc: 0x00.25486d itc: 3 flg: E typ: 1 - DATA 
: 0x100a711 ver: 0x01 opc: 0 
g: 0 


Flag Lck Scn/Fsc 

.000.00000000 0x00000000.0000.00 C--- 0 scn 0x0000.0025486d 
.000.00000000 0x00000000.0000.00 ---- 0 fsc 0x0000.00000000 
.000.00000000 0x00000000.0000.00 ---- 0 fsc 0x0000.00000000 


data block dump,data header at 0x8eb227c 





tsiz: Ox1f80 

hsiz: 0x16 

pbl: 0x08eb227c 

bdba: 0x0100a714 

76543210 

flag-----ntab-1 ---- 有 1 个 表 ， 如 果 是 CLUSTER， 可 能 大 于 1 
nrow-2 ---- 有 2 行 

frre--1 

fsbo-0x16 ---- 空 闲 空 间 的 开始 (44+NO_OF_ITLS*24+0x16) , HH 




















H NO OF ITLS 表示 itl ji E: 








fseo-0x1e70 ---- 空 空间 的 尾部 (44«-NO OF. ITLS*24 +0x1le70) 
avsp=0xle5a 

tosp-0x1e5a 

Oxe:pti[0] nrow-2 offs=0 

Ox12:pri[0] offs=0x1£79 ---- 第 一 行 的 
0x14:pri[1] offs-0x1e70 ---- 第 二 行 的 
block row dump: 

tab 0, row 0, G0x1f79 ---- 第 一 行 
tl: 7 fb: --H-FL-- lb: 0x0 cc: 

col 0: *NULL* 

col 1: [ 2] c1 02 ----Xfü 1 

tab 0, row 1, G0x1e70 ----# 
tl: 263 fb: --H-FL-- lb: 
col 0: [254] 


Eg Ox1£79+ (44-*NO | 
上 为 0x1e70- (44«*NO. 

















2 


— Ë= 


IT 
ÜxÜ cc: 


OF ITLS*24) 
OF ITLS*24) 
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31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 
36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 
31 32 33 34 35 36 37 38 39 30 31 32 33 34.35 36 37 38 39 30 31 32 33 34 35 
36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 
31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 
36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 
3132 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 
36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32 33 34 35 36 37 38 39. 30 
31 32 33 34 35 36 37 38 39 30 31 32 33 34. 35 36 37 38 39 30 31 32 33 34. 35 
36 37 38 39 30 31 32 33 34 35 36 37 38 39 30 31 32.33 34 35 36 37 38 39 30 
31 32 33 34 

col 1: [ 2] cl 03 --Xf 2 





end of block dump 

下 面 我 们 通过 裸 文 件 来 分 析 。 使 用 aa 命令 可 以 将 这 个 数据 块 的 信息 转 储 出 来 (如 果 在 
Windows 下 需要 使 用 dd 工具 ， 可 以 安装 Cygwin。 它 是 一 个 在 Windows 下 模拟 Linux Shell 的 软 
件 ， 安 装 后 可 以 执行 大 多 数 Linux 下 的 命令 )。 

首先 我 们 看 看 前 面 的 20 个 字 节 ， 这 20 个 字 节 是 : 


06 A2 00 00 14 A7 00 01 6E 48 25 00 00 00 02 04 
F1 DD 00 00 


对 应 的 数据 结构 为 kcbh (前 面 已 经 介绍 过 这 个 结构 ， 这 里 不 再 重复 )。 

其 中 第 0 个 字 节 为 类 型 06 表示 是 数据 块 ,第 1 个 字 市 是 FRMT ,一 般 是 0x02, 这 里 是 0xA2, 
用 掩 码 0x0f 取出 就 是 0x02。 第 4~7 个 字 节 为 14A70001, 是 rdba 0x100A714 (4/42772), 
就 是 这 个 块 。 第 8 一 13 个 字 节 是 SCN (前 面 4 个 是 BASE, 后 面 是 WRAP): 6E 48 25 00 00 00 
即 十 六 进 制 的 0x254864.00。 第 14 个 字 节 02 是 SEQ; sEQ=0x02。 第 15 个 字 节 04 是 标志 : 
FLAG=0x04, 4 16~17 NZ F1 DD 是 校 验 和 Oxdd£1, 

从 第 20 个 字 节 开始 的 24 FE 


00 01 02 03 04 05 06 07 08 09 
F1 DD 00 00 01 00 00 00 5C CC 00 
00 00 00 00 03 00 32 00 11 A7 00 01 FF FF 00 00 


其 中 第 20 个 字 节 01 表示 type=01, 第 24 —27 AA 5c cc 00 00 表示 十 六 进 制 的 0xcc5c 
(注意 , 这 里 有 UB4 的 字 布 对 齐 问题 , 所 以 前 面 空 了 3 个 字 节 )。 第 28—35 个 字 节 是 6D 48 25 00 
00 00 00 00, 表 示 SCN 为 0x0025486d.0000。 第 36~37 个 字 节 表示 ITL 插 模 的 数量 ,用 0x00ff 
掩 码 。 本 例 中 为 03 00, 表示 有 3 个 IIL 槽 。 第 38 个 字 节 是 标志 : FLAG=32。 第 39 个 字 节 00 
表示 FSL。 第 40~43 个 字 节 11 A7 00 01 表示 下 一 个 free 块 的 地 址 ， 即 rdba 0x100a711。 
从 第 44 个 字 节 开始 是 ITL 表 , 每 个 ITL 记录 的 长 度 为 24。 从 前 面 可 以 看 到 这 个 块 有 3 个 ITL 
因此 ITL 占 72 NET. 

下 面 我 们 开始 分 析 : 




















0A OB OC OD OE OF 


00 6D 48 25 00 





FR 


H* 


00 01 02 03 04 05 06 07 08 09 OA OB OC OD 
00 00 00 00 03 00 32 00 11 A7 00 O1 FF FF 
00 00 00 00 00 00 00 00 00 00 00 00 00 80 
6D 48 25 00 00 00 00 00 00 00 00 00 00 00 


OE OF 
00 00 
00 00 
00 00 
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其 中 第 44—51 个 字 节 为 XID (8 个 字 节 ): FF FF 00 00 00 00 00 00， 表 示 
Oxffff.0000.00000000, 28 52—59 个 字 节 为 UBA (8 个 字 节 ): 00 00 00 00 00 00 00 00, 
A) 0x00000000.0000.00,28 60—61 个 字 节 (2 4 5E753):00 80 为 标志 ,表示 十 六 进 制 的 0x0800, 
第 62 一 67 个 字 节 为 scn:00 00 6D 48 25 00， 即 0x00254864.00。 这 个 块 有 两 个 ITL 槽 , 今后 
计算 所 有 位 置 都 要 根据 这 个 来 计算 。 

下 面 我 们 来 看 这 部 分 数据 : 

00 01 02 03 04 05 06 07 08 09 OA OB OC OD OE OF 


00 00 00 00 00 01 01 00 FF FF 14 00 8E 1F 7A 1F 
7a 1£ 00 00 01 00 8e 1f 


其 中 第 100 个 字 布 表示 FLAG=0(-------------- )。 第 101 个 字 节 表示 NTAB 为 1, 块 中 有 一 张 表 
的 数据 ,第 102~ 103 个 字 节 01 00 表示 nrow=1, 块 中 有 一 条 记录 。 第 104 一 105 个 字 节 为 ft ££, 
7B 106—107 个 字 节 为 14 00， 即 十 六 进 制 的 0x14， 块 中 空闲 空间 的 起 始 。 第 108—109 个 字 节 为 
8e 1E， 即 十 六 进 制 的 0x1fB8e， 块 中 空闲 空间 的 终止 。 第 110—111 个 字 节 为 7a 1E， 即 十 六 进 制 
的 0xlf7a， 块 中 可 用 空间 。 第 112—113 个 字 节 为 7a 1f， 即 十 六 进 制 的 0x1f7a。 


& 2 优化 小 技巧 ) 通过 树 转 储 来 分 析 索 引 碎 片 


在 前 面 的 优化 方案 设计 时 , 我 们 谈 到 了 重建 索引 的 问题 。 由 于 索引 是 B 树 结构 ， 所 以 经 过 一 
定时 间 的 数据 变更 , 会 由 于 市 点 分 裂 而 导致 出 现 较 多 的 碎片 。 我 在 前 面 说 过 , 通过 查看 索引 的 大 
小 来 判断 是 否 存在 碎片 。 不 过 这 种 方法 比较 粗略 ， 如 采 要 详细 了 解 索引 碎片 的 情况 ， 可 以 通过 树 
转 储 来 进行 分 析 。 下 面 就 通过 树 转 储 来 分 析 索 引 分裂 。 

下 面 分 析 B 树 索引 (本 次 分 析 是 在 自动 段 存储 管理 模式 下 进行 的 )。 

1. 创建 测试 表 

首先 创建 一 张 测试 表 ， 然 后 使 用 dba-object 中 的 数据 创建 一 些 测试 数据 : 


SOL» CREATE sequence seql ; 

序列 已 创建 。 

SQL> CREATE table tobj AS SELECT seql.nextval seqi1,object id,object name FROM 
dba objects WHERE rownum<8000; 

表 已 创建 。 
SQL> CREATE index idx tobj on tobj(seql) pctfree 0; 
索引 已 创建 。 


2. 转 储 索引 的 B 树 
首先 找到 这 个 索引 对 应 的 OBJECT. ID: 


SOL» SELECT object id,object name FROM user objects WHERE object name LIKE 'IDX $'; 
OBJECT ID OBJECT NAME 


32147 IDX TTA2 
32019 IDX T SAMPLEI1 
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然后 通过 treedump 事件 将 索引 的 树 结构 转 储 出 来 : 

SOL» ALTER session set events 'immediate trace name treedump level 32147'; 

会 话 已 更 改 。 

查看 Trace 文件 : 

一 一 一 一 一 begin tree dump 

branch: 0x14039f4 20986356 (0: nrow: 31, level: 1) 
leaf: 0x14039f5 20986357 (-1: nrow: 267 rrow: 267) 
leaf: 0x14039£6 20986358 (0: nrow: 260 rrow: 260) 
leaf: 0x14039f7 20986359 (1: nrow: 260 rrow: 260) 
leaf: 0x14039£8 20986360 (2: nrow: 260 rrow: 260) 
leaf: 0x14039£9 20986361 (3: nrow: 260 rrow: 260) 
leaf: 0x14039fa 20986362 (4: nrow: 260 rrow: 260) 
leaf: 0x14039fb 20986363 (5: nrow: 260 rrow: 260) 
leaf: 0x14039fc 20986364 (6: nrow: 260 rrow: 260) 
leaf: 0x14039fd 20986365 (7: nrow: 260 rrow: 260) 
leaf: 0x14039fe 20986366 (8: nrow: 260 rrow: 260) 
leaf: 0x14039ff 20986367 (9: nrow: 260 rrow: 260) 
leaf: 0x1403a00 20986368 (10: nrow: 260 rrow: 260) 
leaf: 0x1403a02 20986370 (11: nrow: 260 rrow: 260) 
leaf: 0x1403a03 20986371 (12: nrow: 260 rrow: 260) 
leaf: 0x1403a04 20986372 (13: nrow: 260 rrow: 260) 
leaf: 0x1403a05 20986373 (14: nrow: 260 rrow: 260) 
leaf: 0x1403a06 20986374 (15: nrow: 260 rrow: 260) 
leaf: 0x1403a07 20986375 (16: nrow: 260 rrow: 260) 
leaf: 0x1403a08 20986376 (17: nrow: 260 rrow: 260) 
leaf: 0x1403a09 20986377 (18: nrow: 260 rrow: 260) 
leaf: 0x1403a0a 20986378 (19: nrow: 260 rrow: 260) 
leaf: 0x1403a0b 20986379 (20: nrow: 260 rrow: 260) 
leaf: 0x1403a0c 20986380 (21: nrow: 260 rrow: 260) 
leaf: 0x1403a0d 20986381 (22: nrow: 260 rrow: 260) 
leaf: 0x1403a0e 20986382 (23: nrow: 260 rrow: 260) 
leaf: 0x1403a0f 20986383 (24: nrow: 260 rrow: 260) 
leaf: 0x1403a10 20986384 (25: nrow: 260 rrow: 260) 
leaf: 0x1403a12 20986386 (26: nrow: 260 rrow: 260) 
leaf: 0x1403a13 20986387 (27: nrow: 260 rrow: 260) 
leaf: 0x1403a14 20986388 (28: nrow: 260 rrow: 260) 
leaf: 0x1403a15 20986389 (29: nrow: 192 rrow: 192) 

EB end tree dump 

下 面 看 看 分 支 节 点 : 

branch: 0x14039f4 20986356 (0: nrow: 31, level: 1) (5/14836) 

我 们 找到 分 支 节 点 的 RDBA 为 (5/14836)。 下 一 步 通过 块 转 储 ， 看 看 这 个 分 支 节 点 的 逻辑 数 


SOL» alter system dump datafile 5 block 14836; 
系统 已 更 改 。 


下 面 是 转 储 出 来 的 数据 块 逻辑 结构 : 


kdxbrlmc 20986357=0x14039£5 
kdxbrsno 0 
kdxbrbksz 3964 
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row#0[3955] dba: 20986358=0x14039f6 
col 0; len 3; (3): c2 03 45 
col 1; TERM 
row#1[3946] dba: 20986359=0x14039£7 
col 0; len 3; (3): c2 06 1d 
col 1; TERM 
row#2 [3937] dba: 20986360=0x14039£8 
col 0; len 3; (3): c2 08 59 
col 1; TERM 
row#3 [3928] dba: 20986361=0x14039£9 
col 0; len 3; (3): c2 Ob 31 
col 1; TERM 
row#4[3919] dba: 20986362=0x14039fa 
col 0; len 3; (3): c2 0e 09 











col 1; TERM 

row#5[3910] dba: 20986363=0x14039fb 
col 0; len 3; (3): c2 10 45 

col 1; TERM 

row#6[3901] dba: 20986364=0x14039fc 
col 0; len 3; (3): c2 13 1d 

col 1; TERM 

row#7 [3892] dba: 20986365=0x14039fd 
eol 0z len 3; (3): 2 15 59 

col 1; TERM 


row#8 [3883] dba: 20986366=0x14039fe 
col 0; len 3; (3): c2 18 31 
col 1; TERM 
row#9[3874] dba: 20986367=0x14039f£ 
col 0; len 3; (3): c2 1b 09 
col 1; TERM 
row#10[3865] dba: 20986368=0x1403a00 
col 0; len 3; (3): c2 1d 45 
col 1; TERM 
row#11[3856] dba: 20986370=0x1403a02 
col 0; len 3; (3): c2 20 1d 























col 1; TERM 

row#12[3847] dba: 20986371=0x1403a03 
col 0; len 3; (3): c2 22 59 

col 1; TERM 

row#13 [3838] dba: 20986372=0x1403a04 
col 0; len 3; (3): c2 25 31 

col 1; TERM 


row#14[3829] dba: 20986373=0x1403a05 
col 0; len 3; (3): c2 28 09 





col 1; TERM 

row#15[3820] dba: 20986374=0x1403a06 
col 0; len 3; (3): c2 2a 45 

col 1; TERM 


row#16[3811] dba: 20986375=0x1403a07 
col 0; len 3; (3): c2 2d 1d 




















col 1; TERM 
row#17[3802] dba: 20986376=0x1403a08 
col 0; len 3; (3): c2 2£ 59 











col 1; TERM 
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row#18[3793] dba: 20986377=0x1403a09 
col 0; len 3; (3): c2 32 31 


row#19[3784] dba: 20986378=0x1403a0a 
col 0; len 3; (3): c2 35 09 


















































col 1; TERM 

row#20[3775] dba: 20986379=0x1403a0b 
col Q; len 3; (3): c2 37 45 

col 1; TERM 

row#21[3766] dba: 20986380=0x1403a0c 
col 0; len 3; (3): c2 3a 1d 

col 1; TERM 

row#22[3757] dba: 20986381=0x1403a0d 
col 0; len 3; (3): c2 3e 59 

col 1; TERM 

row#23[3748] dba: 20986382=0x1403a0e 
col 0; Len 3; (3): e2 3E 31 

col 1; TERM 

row#24[3739] dba: 20986383=0x1403a0f 
col 0; len 3; (3): c2 42 09 

col 1; TERM 

row#25[3730] dba: 20986384=0x1403a10 
col 0; len 3; (3): c2 44 45 

col 1; TERM 

row#26[3721] dba: 20986386=0x1403al12 
col 0; len 3; (3): c2 47 1d 

col 1; TERM 

row#27[3712] dba: 20986387=0x1403a13 
col 0; len 3; (3): c2 49 59 

col 1; TERM 

row#28[3703] dba: 20986388-20x1403a14 
col 0; len 3; (3): «c2 ác 31 

col 1; TERM 

row#29[3694] dba: 20986389=0x1403a15 
col 0; len 3; (3): c2 4f 09 

col 1; TERM 


-一 一 一 一 end of branch block dump ----- 
End dump data blocks tsn: 5 filets: 5 minblk 14836 maxblk 14836 


这 个 枝 节点 中 共有 30747, 索引 到 31 个 叶 节 点 。 这 个 结果 和 treedump 的 结果 类 似 。 
我 们 来 看 第 047: 
row#0[3955] dba: 20986358=0x14039£6 


col 0; len 3; (3): «c2 03 45 
col 1; TERM 


对 应 的 值 是 c2 03 45 (对 应 的 十 进 制 为 268)， 对 应 的 DBA 是 0x14039£6, 
3. 普通 时节 点 分 裂 分 析 
首先 通过 插入 数据 来 使 索引 数据 发 生 一 些 变化 : 


SOL» insert into tobj values (260,123,'sss'); 
已 创建 1 fr. 
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SQL» commit; 
提交 完成 。 


然后 再 次 转 储 B 树 : 


SOL» ALTER SESSION SET EVENTS 'immediate trace name treedump level 32147'; 
ANF 
会 话 已 更 改 。 


我 们 看 看 数据 发 生 了 什么 样 的 变化 : 


一 一 一 一 一 begin tree dump 





branch: 0x14039f4 20986356 (0: nrow: 32, level: 1) 
leaf: 0x14039f5 20986357 (-1: nrow: 142 rrow: 142) 叶 节 点 分 裂 
leaf: 0x1403a19 20986393 (0: nrow: 126 rrow: 126) 
leaf: 0x14039f6 20986358 (1: nrow: 260 rrow: 260) 
leaf: 0x14039f7 20986359 (2: nrow: 260 rrow: 260) 
leaf: 0x14039f8 20986360 (3: nrow: 260 rrow: 260) 
leaf: 0x14039f9 20986361 (4: nrow: 260 rrow: 260) 
leaf: 0x14039fa 20986362 (5: nrow: 260 rrow: 260) 
leaf: 0x14039fb 20986363 (6: nrow: 260 rrow: 260) 
leaf: 0x14039fc 20986364 (7: nrow: 260 rrow: 260) 
leaf: 0x14039fd 20986365 (8: nrow: 260 rrow: 260) 
leaf: 0x14039fe 20986366 (9: nrow: 260 rrow: 260) 
leaf: 0x14039ff 20986367 (10: nrow: 260 rrow: 260) 
leaf: 0x1403a00 20986368 (11: nrow: 260 rrow: 260) 
leaf: 0x1403a14 20986388 (29: nrow: 260 rrow: 260) 
leaf: 0x1403a15 20986389 (30: nrow: 192 rrow: 192) 








从 前 面 这 几 行 数据 ; 
一 一 一 一 一 begin tree dump 
branch: 0x14039f4 20986356 (0: nrow: 32, level: 1) 


leaf: 0x14039f5 20986357 (-1: nrow: 142 rrow: 142) 
leaf: 0x1403a19 20986393 (0: nrow: 126 rrow: 126) 


如 果 我 们 把 这 些 数据 和 插入 数据 前 的 转 储 数据 相 比 ， 就 可 以 看 出 此 时 产生 了 叶 节 点 分 裂 。 

4. 看 看 删除 的 记录 是 否 能 被 重用 

首先 我 们 重新 准备 测试 数据 ， 删 除 刚 才 的 测试 索引 , 并 且 重 建 索引 。 为 了 能 够 很 快 看 到 叶 市 
点 分 裂 的 情况 ， 创 建 索引 时 ， 我 们 将 pctfree 参数 设置 为 0: 


DROP index idx tobj; 

CREATE index idx tobj on tobj(seql) pctfree 0; 

DELETE tobj WHERE seql=260; 

INSERT INTO tobj VALUES (260,260,'sss'); 

SELECT object id,object name FROM user objects WHERE object name LIKE 'IDX$'; 





SOL» ALTER SESSION SET EVENTS 'immediate trace name treedump level 32148'; 
AGA 
会 话 已 更 改 。 


此 时 我 们 得 到 的 索引 的 树 结构 如 下 : 
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branch: 0x14039f4 20986356 ( 
leaf: 0x14039f5 20986357 
leaf: 0x1403a19 20986393 


0: nrow: 32, level: 1) 
( 
( 
leaf: 0x14039f6 20986358 ( 
( 
( 
( 
( 


-1: nrow: 142 rrow: 142) 
: nrow: 126 rrow: 124) 
: nrow: 260 rrow: 260) 

leaf: 0x14039f7 20986359 

leaf: 0x14039f8 20986360 

leaf: 0x1403a14 20986388 

leaf: 0x1403a15 20986389 
-一 一 一 一 end tree dump 


看 来 叶 市 点 分 裂 还 是 发 生 了 。 说 明 删 除 记 录 的 空间 无 法 被 使 用 , 这 个 和 Oracle 概念 里 是 相同 
下 面 我 们 测试 一 下 ， 看 看 删除 某 个 块 中 的 绝 大 多 数值 是 什么 样 的 : 

----- begin tree dump 

branch: 0x14039f4 20986356 (0: nrow: 31, level: 1) 


leaf: 0x14039f5 20986357 (-1: nrow: 267 rrow: 267) 
leaf: 0x14039£6 20986358 (0: nrow: 260 rrow: 260) 


首先 转 储 出 叶 市 点 0x14039£5 (5, 14837) 的 逻辑 数据 : 


row#0[3928] flag: ----- , lock: 0 
col 0; len 2; (2): c1 02 /* 第 一 行 ， 十 进 制 1*/ 
col 1; len 6; (6): 01 40 39 94 00 00 


: nrow: 260 rrow: 260) 





0 
1 
2: nrow: 260 rrow: 260) 
3 
2 
3 


9: nrow: 260 rrow: 260) 
0: nrow: 193 rrow: 193) 


row#266[570] flag: ----- , lock: 0 
col 0; len 3; (3): c2 03 44 /* 最 后 一 行 ， 十 进 制 267*/ 
col 1; len 6; (6): 01 40 39 97 00 Od 


然后 我 们 删除 绝 大 多 数 数据 : 


DELETE tobj WHERE seql<267; 









































下 面 来 看 这 个 叶 节 点 的 信息 : 除了 最 后 一 行 外 , 其 他 的 都 是 标志 ---D-, 说 明 是 被 删除 的 行 。 
row#0[3928] flag: ---D-, lock: 2 

col 0; len 2; (2): c1 02 

col 1; len 6; (6): 01 40 39 94 00 00 
row#1[3916] flag: ---D-, lock: 2 

col 0; len 2; (2): cl 03 

col 1; len 6; (6): 01 40 39 94 00 01 
row#2[3904] flag: ---D-, ock: 2 

col 0; len 2; (2): c1 04 

col 1; len 6; (6): 01 40 39 94 00 02 
row#3 [3892] flag: ---D-, lock: 2 

col 0; len 2; (2): ci 05 

col 1; len 6; (6): 01 40 39 94 00 03 
row#4[3880] flag: ---D-, lock: 2 

col 0; len 2; (2): cl 06 

col 1; len 6; (6): 01 40 39 94 00 04 
row#5[3868] flag: ---D-, lock: 2 

col 0; len 2; (2): c1 07 
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col 1; len 6; (6): 01 40 39 94 00 05 
row#6[3856] flag: ---D-, lock: 2 

col 0; len 2; (2): c1 08 

col 1; len 6; (6): 01 40 39 94 00 06 
row#264[596] flag: ---D-, lock: 2 

col 0; len 3; (3): c2 03 42 

col 1; len 6; (6): 01 40 39 97 00 Ob 
row#265[583] flag: ---D-, lock: 2 

col 0; len 3; (3): c2 03 43 

col 1; len 6; (6): 01 40 39 97 00 Oc 
row#266[570] flag: ----- , lock: Ü 

col 0; len 3; (3): c2 03 44 

col 1; len 6; (6): 01 40 39 97 00 Od 
----- end of leaf block dump ----- 
End dump data blocks tsn: 5 filet: 5 minblk 14837 maxblk 14837 


这 个 时 候 再 插入 一 行 : 


INSERT INTO tobj VALUES(100,1,'sss'); 


commit; 


然后 再 看 看 treedump 的 结果 : 


branch: 0x14039f4 20986356 (0 
leaf: 0x14039f5 20986357 ( 

( 

( 

( 








: nrow: 31, level: 1) 
-1: nrow: 2 rrow: 2) 
leaf: 0x14039f6 20986358 
leaf: 0x14039f7 20986359 
leaf: 0x14039f8 20986360 


这 时 并 没有 发 生 叶 市 点 分 裂 。 看 看 页 块 中 的 信息 : 


0: nrow: 260 rrow: 260) 
1: nrow: 260 rrow: 260) 
2: nrow: 260 rrow: 260) 


row#0[558] flag: ----- , lock: 2 

col 0; len 2; (2): c2 02 

col 1; len 6; (6): 01 40 39 95 00 55 
row#1[570] flag: ----- , lock: 0 


col 0; len 3; (3): c2 03 44 

col 1; len 6; (6): 01 40 39 97 00 0d 

----- end of leaf block dump ----- 

End dump data blocks tsn: 5 filet: 5 minblk 14837 maxblk 14837 


叶 池 点 被 重新 格式 化 了 。 这 好 像 和 概念 中 的 不 同 , 我们 再 来 分 析 一 下 什么 时 候 会 产生 重新 格 
式 化 呢 ? 

5. 看 看 叶 节点 重新 格式 化 的 条 件 

首先 我 们 重新 创建 测试 环境 ， 重 建 表 和 序列 号 : 


SQL> drop sequence seq1; 


序列 已 丢弃 。 








SQL» create sequence seql; 


序列 已 创建 。 
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SOL» drop table tobj; 
AU ES. 


SOL» create table tobj as select seql.nextval seqi,object id,object name from 
dba objects where rownum<8000; 


表 已 创建 。 





SQL> create index idx tobj on tobj(seql) pctfree 0; 


索引 已 创建 。 











SOL» SELECT object id,object name FROM user objects WHERE object name LIKE 'IDX$'; 


OBJECT ID OBJECT NAME 


32183 IDX TOBJ 
32100 IDX TTA2 
32019 IDX T SAMPLE1 


这 时 转 储 出 索引 的 树 结构 ， 应 该 和 前 面 实验 看 到 的 一 样 。 下 面 我 们 的 实验 该 变 了 ,删除 记录 
后 再 提交 ， 然 后 再 次 插入 数据 ， 看 看 结果 会 如 何 呢 ? 


SQL> DELETE tobj WHERE Seql=100; 
已 删除 1 行 。 





SOL» commit; 
提交 完成 。 


SQL» INSERT INTO tobj VALUES (100,1,'sss'); 
已 创建 1 fr. 











SQL» commit; 
提交 完成 。 


我 们 来 看 看 这 次 实验 的 treedump: 


branch: 0x14039f4 20986356 ( 
leaf: 0x14039f5 20986357 


0: nrow: 31, level: 1) 
( 
leaf: 0x14039f6 20986358 ( 
( 
( 
( 


1: nrow: 267 rrow: 267) 
nrow: 260 rrow: 260) 
nrow: 260 rrow: 260) 
nrow: 260 rrow: 260) 
nrow: 260 rrow: 260) 


leaf: 0x14039f7 20986359 
leaf: 0x14039f8 20986360 


0 
1 
2 
leaf: 0x14039f9 20986361 (3 


从 treedump 中 ， 我 们 并 没有 看 到 叶 节 点 分 裂 ， 那 么 再 来 看 看 第 一 个 叶 节 点 的 信息 : 


row#99[2740] flag: ----- , lock: 0 
col 0; len 2; (2): c2 02 
col 1; len 6; (6): 01 40 39 95 00 Od 


这 个 模 位 被 重用 了 。 从 这 可 以 看 出 ， 一 旦 提交 ,索引 立即 被 重组 。 被 删除 的 记录 所 占用 的 空 
间 立 即 可 以 被 重用 。 但 是 ,如 果 事 务 中 没有 提交 前 插入 的 行 不 能 使 用 刚才 被 删除 行 留 下 来 的 空 困 
位 置 ， 那 么 在 数据 块 已 满 的 情况 下 ， 就 会 导致 叶 市 点 分 裂 。 

为 什么 Oracle 不 马上 把 删除 的 数据 留 下 的 空闲 空间 利用 起 来 呢 ? 实际 上 这 个 问题 很 好 理解 。 
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如 果 这 么 做 ， 那 么 一 旦 这 个 事务 回 深 了 ， 回 深 操 作 的 成 本 是 不 是 会 变 得 十 分 高 呢 ? 

实际 上 , 从 上 面 的 实验 我 们 可 以 学 到 一 些 优化 技巧 。 如 果 一 张 表 经 常会 进行 删除 、 插入 操作 ， 
那么 这 张 表 上 相关 的 索引 可 能 经 常会 出 现 叶 节点 分 裂 , 严重 时 索引 的 碎片 化 会 很 严重 , 影响 该 索 
引 的 性 能 。 对 于 这 种 情况 , 适当 减少 批量 提交 ,可 以 减轻 索引 碎片 化 。 如果 我 们 的 应 用 无 法 调整 ， 
那么 经 常 对 这 类 索引 进行 重建 或 者 在 线 重建 ， 也 是 十 分 必要 的 。 
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昨天 由 于 飞机 晚点 ， 回 到 沈阳 已 经 比较 晚 了 ,所 以 就 直接 回 宾馆 休息 了 。 晚上 和 老 于 磁 了 一 
下 ， 有 一 个 十 分 好 的 消息 ， 就 是 那个 该 死 的 12 张 表 连接 的 SQL 终于 修改 完毕 了 。 开 发 商 在 测试 
环境 测试 了 ,效果 十 分 好 。 去 掉 占 位 操作 后 ,执行 计划 十 分 完美 , 开销 减少 到 了 原来 的 万 分 之 一 
以 下 。 

昨天 说 好 了 ， 开 发 商 计 划 16 日 晚上 正式 发 布 这 个 新 补丁 ， 因 此 今天 早上 一 上 班 ， 我 和 老 于 
迫不及待 地 连 到 账 务 系统 上 ， 查 看 系统 的 运行 情况 。 账 务 系统 的 CPU 资源 一 直 存在 较为 严重 的 
瓶颈 ,不 过 从 今天 早上 的 现象 来 看 ,CPU 资源 得 到 了 很 大 的 缓解 , 平均 使 用 率 从 以 前 的 超过 90% 
下 降 为 60% 左 右 。 通 过 STATSPACK 报告 查看 那个 12 张 表 连 接 的 SQL， 发 现 平均 每 次 执行 产生 
的 缓冲 区 获取 为 64， 物 理 读 为 2， 执行 时 间 为 33s。 而 在 优化 前 ， 这 个 SQL 的 开销 是 平均 为 此 执 
fr 140 万 逻辑 读 ，55 万 物理 读 ， 执 行 时 间 为 639s。 

老 于 打 了 个 电话 给 开发 商 , 向 他 们 表示 祝贺 ,开发 商 那 思 也 十 分 高 兴 。 昨 天 三 套 系统 中 优化 
完成 的 SQL 都 已 经 发 布 ， 从 BILL, CAL 和 BSS 三 套 系统 今天 上 午 的 表现 来 看 ， 效 果 十 分 好 。 
如 果 这 种 现象 能 够 保持 , 那么 这 个 项 目 应 该 可 以 圆满 结束 了 。 今天 所 有 的 优化 工作 都 能 够 测试 完 
HE, 晚上 将 发 布 剩 下 的 十 多 个 模块 。 如 果 明 天 上 午 能 够 确认 优化 效果 ， 开 发 商 建议 向 甲 方 提 出 验 
收 申请 。 

我 坐 到 小 孙 身 旁 , 让 他 打开 BBS， 看 看 上 面 是 否 有 一 些 好 的 反馈 。 这 几 天 BBS 上 人 气 不 旺 ， 
只 有 少量 的 信息 ,不 过 今天 早上 有 两 个 帖子 , 说 发 现今 天 系统 很 快 ， 帖子 的 标题 上 还 有 一 个 很 明 
显 的 笑脸 。 我 让 小 孙 以 优化 小 组 的 名 义 发 了 一 个 帖子 ,说 优化 工作 阶段 性 完成 , 希望 大 家 反馈 对 
系统 性 能 的 评价 。 帖子 发 出 不 到 半 小 时 , 就 有 上 百 个 人 跟 帖 。 从 跟 帖 上 来 看 , 大 多 数 都 是 正面 的 ， 
其 至 还 有 人 喊 出 了 “万 岁 ” 的 口号。 不 过 也 有 不 少 人 提出 ， 以 前 也 做 过 优化 ， 不 过 效果 总 是 不 能 
持久 ， 不 知道 这 次 是 回光返照 还 是 确实 系统 调 好 了 。 

我 打 电话 给 张 工 , 希望 他 能 够 找 几 个 营业 厅 , 打 电 话 过 去 询问 一 下 。 张 工 还 不 知道 昨天 晚上 
上 线 了 大 部 分 模块 ,还 有 点 不 放心 , 希望 我 能 够 确认 一 下 ， 怕 电话 打 过 去 不 是 那么 回 事 ,还 被 营 
业 厅 恶心 一 把 。 我 让 他 放心 ， 优 化 效果 是 通过 多 方面 确认 过 的 ， 绝 对 不 会 出 问题 。 张 工 找 了 几 个 
业务 量 比较 大 的 营业 厅 , 通过 电话 进行 了 确认 。 和 营业 厅 那 边 的 反馈 都 很 不 错 ， 连 平时 总 是 排 长 队 
的 几 个 营业 厅 都 感觉 今天 的 业务 处 理 速度 快 了 很 多 ,看 不 到 往常 的 长 队 了 。 我 说 再 问 问 异 地 的 营 
业 厅 吧 。 
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过 了 10 分钟， 张 工 突然 打 电 话 来 问 ， 是 不 是 现在 系统 又 出 问题 了 ， 营 口 那 边 反馈 系统 突然 
变 慢 了 ， 而且 比 以 前 还 慢 。 我 和 老 于 急忙 跑 到 办 公 室 。 从 OEM 的 监控 上 看 ， 数 据 库 很 正常 ， 操 
作 系 统 的 各 项 指标 也 和 刚 上 班 时 一 样 。 

我 立即 联系 了 营口 那 边 的 维护 人 员 , 从 他 那 边 反馈 的 信息 是 早上 一 上 班 系统 很 不 错 , 速度 比 
平时 快 了 不 少 , 不 过 1 个 小 时 前 ， 系 统 突然 变 慢 了 ,而 且 一 下 子 变 得 特别 慢 。 他 也 测试 过 ， 通 过 
SQL*Plus 连接 数据 库 也 很 慢 ， 而 且 连 上 去 后 做 SELECT 操作 也 十 分 慢 。 我 建议 他 马上 连 上 去 ， 
做 一 个 10 级 的 10046 Trace, 看 看 主要 的 等 待 事件 是 什么 。 在 电话 中 经 过 10 分 钟 的 沟通 , 终于 将 
ALTER SYSTEM SET EVENTS-'10046 TRACE NAME CONTEXT FOREVER,LEVEL 10' 的 命令 执行 
完毕 。 从 Trace 文件 上 看 ， 大 量 的 等 待 事件 是 SOL*Net 系列 的 ， 比 如 SQL*Net more data to client 
等 。 我 这 边 还 在 和 营口 的 维护 人 员 打 电话 ， 老 于 已 经 打开 了 Trace 文件 看 了 起 来 ， 说 :“ 老 白 ， 
让 他 们 查 查 网 络 , 都 是 SQL*Net 的 等 待 。 我 马上 让 他 们 做 一 个 ping 服务 器 的 操作 , 普通 的 ping 
很 正常 ， 不 过 ping 大 包 时 ， 包 丢失 情况 很 严重 ， 大 概 有 50% 以 上 的 包 会 丢失 。 该 不 是 中 了 冲击 
波 病 毒 了 吧 ， 看 着 这 个 情况 ， 我 的 第 一 反应 是 病毒 。 

半 个 小 时 后 ， 营 口 那 边 确认 了 ， 有 几 台 微机 染 上 了 冲击 波 病毒 。 关 闭 那 几 台 机 器 后 ， 系 统 恢 
复 了 正常 。 被 营口 的 事情 折腾 了 小 半天 ， 安 静 下 来 后 才 发 现 ， 已 经 到 中 午 了 。 吃 完 午饭 ， 老 于 和 
小 齐 联系 了 一 下 ， 把 这 边 的 情况 简单 说 了 说 。 小 齐 听 了 半天 ， 只 问 了 一 句 话 :“ 我 是 不 是 可 以 向 
集团 公司 申请 验收 了 ? ” 老 于 很 坚决 地 说 :“ 可 以 了 ， 看 样子 我 们 的 优化 工作 可 以 告 一 段落 了 ， 
准备 7 月 上 旬 验 收 吧 。” 

下 午 系统 比较 平稳 , 我 和 老 于 基本 上 没 进 办 公 室 , 每 个 人 抱 着 一 杯 茶 , 坐 在 吸烟 区 抽烟 聊天 。 
经 过 2 个 月 的 紧张 工作 , 我 和 老 于 都 很 需要 放松 放松 。 下午 孙 主 任 打 电 话 给 老 于 ,询问 了 目前 系 
统 的 状态 ， 并 且 通 知 我 们 明天 下 午 到 总 部 开会 ， 讨 论 内 容 是 下 一 步 的 工作 安排 。 

老 于 正在 和 孙 主 任 通电 话 ， 小 齐 的 电话 就 打 进 来 了 。 原 来 小 齐 已 经 把 情况 汇报 给 集团 公司 ， 
集团 公司 建议 尽快 安排 下 一 步 的 工作 计划 , 因为 辽宁 只 是 集团 公司 的 优化 试点 ,根据 辽宁 的 情况 ， 
将 确定 下 一 步 北方 公司 其 他 省 份 的 工作 安排 。 由 于 这 个 项 目 必 须 在 春节 前 全 部 完成 ,因此 集团 公 
司 领导 比 我 们 还 急 。 明 天 的 会 议 ， 集 团 公司 的 相关 领导 将 以 电话 会 议 的 形式 参与 。 我 和 小 齐 说 这 
个 会 能 不 能 推迟 一 天 开 ， 因 为 今天 晚上 还 有 部 分 模块 上 线 ， 如 果 明 天 的 效果 很 好 ， 这 个 会 开 得 比 
较 踏 实 。 小 齐 说 集团 公司 领导 后 天 一 早 就 要 出 国 考察 , 一 周 后 才能 回国 , 现在 一 点 时 间 都 耽误 不 
起 了 。 除 非 明 天 确实 没有 把 握 ， 否 则 这 个 会 就 必须 明天 开 。 我 和 老 于 必须 马上 确定 明天 这 个 会 能 
不 能 

这 时 候 老 于 也 已 经 接 完了 孙 主 任 的 电话 ,， FURIE, 估计 他 们 讨论 的 问题 与 我 和 小 齐 的 
是 相同 的 。 

“ 开 不 开 ? ”我 问 老 于 。 这 么 大 的 事情 ， 我 也 不 敢 轻 易 做 决定 。 如 果 明 天 系统 状态 十 分 正常 ， 
那么 这 个 会 可 以 开 得 很 好 ， 不 过 如 果 系 统 真 的 出 了 问题 ， 那 么 就 很 砷 从 了。 

“不 开 也 得 开 了 , 这 种 情况 没有 任何 理由 说 不 开 , 希望 应 用 不 要 出 问题 。” 老 于 今天 异常 坚决 ， 
看 样子 确实 是 没有 任何 退路 了 。 
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确认 了 明天 开会 后 ， 我 和 老 于 说 我 要 去 小 王 那 边 看 看 ， 对 于 今天 晚上 上 线 的 模块 ,我 要 再 确 
认 一 下 ， 不 要 明天 开会 的 时 候 ， 被 投诉 电话 打 断 。 

今天 真是 奇怪 的 一 天 ， 兴奋 之 余 ， 更 多 的 是 担忧 。 已 经 忙 了 两 个 多 月 了 , 今天 晚上 才 是 最 难 
TBI, 





o» 今日 点 评 

今天 优化 的 效果 已 经 显现 了 ,而 老 白 他 们 又 面临 一 个 选择 ,就 是 明天 的 总 结 会 开 不 开 的 问题 。 
今天 晚上 要 上 线 一 些 重要 的 模块 , 而 明天 的 会 议 北 方 公司 也 要 参加 ,如 果真 的 在 开会 时 发 生 一 些 
问题 ， 那 么 就 很 被 动 了 。 但 是 事实 上 客观 条 件 决定 这 个 会 必须 开 。 这 种 情况 下 ，DBA 的 判断 就 
十 分 重要 了 ， 如 果 风 险 过 大 ,那么 明天 的 会 议 是 坚决 不 能 开 的 。 正 是 因为 老 于 和 老 白 基 于 今天 系 
统 的 情况 ， 才 做 出 了 明天 继续 开会 的 决定 。 

不 过 为 了 确保 明天 这 么 重要 的 会 议 开 得 顺利 ， 老 白 还 是 去 开发 小 组 那里 做 了 一 些 确 认 工 作 。 
确认 工作 主要 是 对 明天 需要 上 线 的 模块 涉及 的 一 些 主 要 SQL 进行 确认 ， 包 括 对 执行 计划 和 开销 
的 比 对 。 确 保 明 天 这 些 SQL 上 线 后 不 会 对 系统 产生 明显 的 副作用 。 


E 2 优化 小 技 瑟 ) VO 系统 优化 的 经 验 与 体会 


在 海量 数据 的 情况 下 ， 数 据 库 的 性 能 问题 有 80% 以 上 和 VO 相关 ， 因 此 ，LO 优化 是 贯穿 海 
量 数据 库 管 理 全 过 程 的 重要 工作 。LO 优化 牵涉 的 面 比较 广 ， 现 在 就 从 Oracle 数据 库 优化 的 一 些 
主要 方面 详细 阐述 一 下 。 在 海量 数据 库 环 境 下 ，Oracle 数据 库 优化 面临 的 最 重要 的 任务 是 VO 优 
化 ， 因 为 绝 大 多 数 大 型 数据 库 都 或 多 或 少 存在 VO 性 能 问题 。 数 据 库 的 IO 性 能 牵涉 面 十 分 广 ， 
因此 VO 性 能 优化 也 是 Oracle 数据 库 优 化 工作 中 最 复杂 的 工作 。 进 行 VO 性 能 优化 ， 基 本 的 步骤 
是 这 样 的 : 
O 采集 系统 数据 ， 定 位 VO 性 能 问题 ， 
a 分 析 并 制订 解决 方案 ; 
O 调整 系统 ， 解 决 问题 ， 
a 评估 优化 结果 。 

优化 Oracle 数据 库 的 VO 性 能 ， 不 能 简单 地 从 IO 入 手 ， 需 要 遵循 数据 库 优 化 工作 的 基本 原 
则 。 首 先 数据 库 优化 的 目的 是 提高 系统 的 整体 处 理 能 力 ,提高 事务 响应 速度 。 所 有 的 优化 工作 都 
需要 围绕 这 个 目的 来 进行 。 数据 库 性 能 优化 的 手段 有 两 个 方面 , 一 是 减少 处 理 时 间 ， 二 是 减少 等 
待 时 间 。 减 少 处 理 时 间 要 求 应 用 编写 得 合理 高 效 。 减 少 等 待 时 间 要 求 系统 的 各 种 资源 合理 分 配 ， 
不 出 现任 何 瓶颈 。 数 据 库 使 用 的 系统 资源 包括 CPU、 内 存 、 存 储 和 网 络 。 数 据 库 优化 的 目的 是 
合理 分 配 这些 资 源 ， 确 保 任何 一 种 资源 都 不 出 现 瓶颈 。 

根据 上 述 原则 ，Oracle 数据 库 的 VO 性 能 优化 不 能 只 通过 重新 组 合 系统 资源 来 达到 提升 数据 
库 总 体 性 能 (包括 VO 性 能 ) 的 目的 。 另 一 个 方面 ， 在 优化 VO 时 也 要 考虑 到 其 他 资源 的 情况 。 
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如 果 VO 单方 面 提升 导致 其 他 资源 出 现 瓶 颈 ， 那 么 也 会 导致 系统 总 体 性 能 下 降 。 特 别 是 针对 资源 
有 限 的 系统 的 优化 ,如 何 有 效 利用 不 足 的 系统 资源 进行 最 优化 的 组 合 , 在 保证 没有 一 种 资源 过 载 
的 情况 下 尽 可 能 利用 资源 ， 是 系统 优化 的 关键 。 

如 何 确 定 系统 的 主要 问题 是 VO 问题 ， 并 进一步 定位 VO 问题 的 根本 原因 是 解决 Oracle IO 
性 能 问题 的 关键 。LO 性 能 不 佳 ， 可 能 是 多 方面 的 问题 。 进 行 优 化 的 第 一 步 就 是 确定 关键 的 性 能 
LA 

影响 Oracle 数据 库 VO 性 能 的 问题 覆盖 面 十 分 广 , 根据 作者 多 年 从 事 Oracle 数据 库 管 理 的 经 
验 ， 下 面 几 个 方面 是 影响 数据 库 VO 性 能 的 主要 问题 。 

a 存储 性 能 瓶颈 : 控制 器 不 足 、Cache 偏 小 ，Cache 设置 不 合理 、1/O 通道 容量 不 足 等 。 
O 磁盘 性 能 瓶颈 : 磁盘 数量 过 少 、 使 用 了 速度 比较 低 的 磁盘 等 。 

a 使 用 了 不 合理 的 RAID 模式 。 

O 在 使 用 RAID 的 情况 下 ， 存 在 IO 热点 ， 多 个 热点 文件 使 用 同一 个 磁盘 。 

O 异步 IO 配置 不 正确 。 

a 数据 库 各 种 缓冲 区 设置 不 合理 ， 缓 冲 命中 率 过 低 。 

a PGA 的 各 种 缓存 设置 过 小 (对 于 Oracle 9i， 在 使 用 自动 管理 模式 的 情况 下 ，PGA 设置 过 
小 ) ， 导 致 大 量 临时 表 空 间 操作 。 

O 重 做 日 志 存 在 性 能 上 瓶颈。 

a 重 做 缓冲 区 设置 不 合理 。 

O 存在 热点 数据 。 

a 表 空 间 碎 片 严 重 。 

a 表 和 索引 的 存储 参数 不 合理 。 

a 行 迁移 比较 严重 。 

O 存在 大 量 大 表 扫 描 的 SQL, 

O SQL 执行 选择 了 不 好 的 执行 计划 。 

当 系 统 出 现 IO 问题 时 , 数据 库 管 理 员 最 大 的 挑战 是 如 何 尽快 找到 问题 的 最 根本 的 原因 。LIO 
问题 的 调整 是 十 分 复杂 的 , 在 没有 找到 根本 原因 前 进行 调整 往往 无 法 达到 最 终 的 优化 目标 。 需要 
注意 的 是 IO 问题 往往 和 大 型 的 SQL 语 名 有关。 如 果 某 个 系统 突然 发 生 VO 性 能 问题 , 第 一 步 需 
要 排除 一 切 VO 以 外 的 问题 。 

确定 IO 性 能 瓶颈 的 存在 ， 并 定位 存在 VO 性 能 瓶颈 的 设备 是 解决 IO 性 能 问题 的 第 一 步 。 
使 用 操作 系统 的 监控 工具 可 以 实时 监控 IO 的 情况 。 第 一 种 方法 是 使 用 vmstat 工具 。 使 用 该 工 
具 ， 可 以 查看 b 列 的 值 ,如 果 该 值 比较 大 ， 那 么 说 明 等 待 LO 的 进程 比较 多 ，LIO 可 能 存在 问题 ， 
如 下 所 示 : 


$vmstat 1 10 
procs memory 
a b w avm free 
2 12 0 14572705 92752 
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2 12 0 14572705 93548 
2 12 0 14572705 92910 
2 12 0 14572705 93467 
2 12 0 14572705 93546 
2 12 0 14572705 93864 
2 12 0 14572705 94557 
2 12 0 14572705 93952 
2 12 0 14572705 94017 
2 12 0 14572705 93047 














如 果 上 述 命令 发 现 b 比较 大 ,那么 说 明 可 能 存在 VO 等 待 的 现象 ,通过 sar 命令 或 者 iostat Ar 
令 可 以 进一步 确认 。 如 果 用 sar 命令 监控 时 发 现 wio 比较 大 (比如 超过 40, 这 个 值 是 个 经 验 值 ， 

















根据 不 同 的 系统 ， 这 个 值 可 以 调整 )， 那 么 基本 上 可 以 确定 存在 VO 性 能 瓶颈 ， 如 下 所 示 : 

$sar 1 10 

HP-UX cuyn16 B.11.11 U 9000/800 11/01/05 
15:01:44 $usr Ssys Swio Sidle 
15:01:45 16 3 57 24 
15:01:46 15 2 59 24 
15:01:47 21 3 57 19 
15:01:48 20 2 63 16 
15:01:49 17 2 67 14 
15:01:50 L T 75 12 
15:01:51 L6 2 75 7 
15:01:52 10 B 84 5 
15:01:53 18 2 79 c 
15:01:54 25 3 65 6 











如 果 发 现 wio 值 长 时 间 高 于 40, 那么 说 明 IO 等 待 比较 严重 。 此 时 可 以 通过 sar-d 命令 来 监控 ， 
看 看 哪些 UO 设备 存在 性 能 问题 。 如 果 发 现 某 个 设备 的 繁忙 度 长 时 间 超过 90%， 就 说 明 该 设备 比 
pe STU, MARIAH avserv 比较 大 或 者 比 其 他 设备 高 很 多 ,就 说 明 该 设备 存在 性 能 问题 。 比 
如 下 面 的 例子 : 


15:02:01 device Sbusy avque rt+w/s blks/s avwait avserv 




















Average c0t0d0 2.00 0.50 6 27 3.62 6.03 
Average c3t8d0 1.10 0.50 4 16 3:23 5.69 
Average c55t0d5 99.40 0.50 18 T3. 5.41 54.50 
Average c55ti1d0 4.20 0.50 5 15 5.39 8.49 
Average c55tid1l 79.52 0.76 24 810 9.09 81.99 
Average c55t10d7 68.33 0.52 23 2909 5.60 72.40 
Average c55t11d0 31.07 1.14 25 1630 10.95 28.05 
Average c55t11d2 16.98 0.51 22 3075 5.24 13.39 
Average c55t11d3 71.83 2.59 26 1643 42.18 82.78 
Average c55t11d5 76.12 0.50 23 3012 5.58 76.47 
Average c55t11d6 30:57 1.02 26 1637 10.85 30.59 
Average c55t12d0 21.48 0.50 20 2826 5,32 19.55 
Average c55t12d1 80.72 2.74 29 1880 42.78 84.38 
Average c55t12d3 70.03 0.52 23 2887 5.83 66.85 
Average c55t12d4 23.58 1.74 27 1758 16.11 25.72 
Average c55t14d0 80.62 0.50 66 975 4.83 12.38 
Average c56t14d2 5.89 0.50 6 75 5.67 10.38 
Average c55t11d1 80.22 0.50 22 1547 4.85 75.33 
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Average c55t11d4 24.08 0.50 26 1829 5.04 11.90 
Average c55t11d7 82.72 0.50 23 1586 5.27 76.46 
Average c55t12d2 24.18 0.50 18 1304 4.79 16.26 
Average c55t12d5 76.02 0.50 20 1403 4.91 74.11 
Average c55t14d1 100.00 54.57 104 6630 1315.98 71.54 
Average c55t13d1 77.72 0.55 19 297 5.79 80.19 
Average c55ti1d4 0.30 0.50 1 10 7.02 1.50 
Average c55t2d0 0.10 0.50 0 3 3.59 6.43 
Average c55t6d2 0.30 0.50 0 6 5.17 7.09 
Average c55t0d7 0.70 0.50 0 2 1.33 69.67 
Average c55t12d6 0.10 0.50 0 0 0.98 9.41 
Average c55t13d0 0.50 0.50 0 4 7.46 19.99 


从 上 面 的 数据 可 以 看 出 ， 部 分 设备 (比如 c55t14d1) 的 等 待 队列 比较 长 ， 并 且 avwaittavserv 
的 时 间 比 较 长 ， 说 明 该 设备 存在 性 能 瓶颈 。 而 大 部 分 HDISK 的 avwaitravserv 还 比较 正常 ， 这 说 
明 存储 系统 并 不 存在 普遍 性 的 性 能 瓶 开 ， 而 性 能 瓶颈 主要 集中 在 热点 盘 组 上 。 

通过 Oracle 的 STATSPACK 工具 也 可 以 检查 系统 的 VO 问题 。 如 果 系 统 的 性 能 不 佳 ， 并 且 从 
报告 中 看 到 的 sequencial read 等 待 事件 是 系统 等 待 事件 中 排 在 前 几 位 的 事件 ， 占 系统 总 等 待 时 间 
的 比例 比较 高 ， 那 么 系统 很 可 能 存在 VO 性 能 问题 。 可 以 通过 检查 文件 VO 情况 来 进一步 确认 并 
找 出 存在 性 能 问题 的 设备 。 方 法 是 通过 检查 文件 IO 中 的 平均 读 响 应 时 间 。 如 果 某 个 文件 的 平均 
读 响 应 时 间 超 过 20ms , 那么 说 明 该 文件 所 属 的 文件 系统 可 能 存在 性 能 问题 。 应 该 注意 的 是 , 20ms 
是 一 个 相对 参数 ,在 不 同 的 应 用 环境 下 该 值 可 能 会 有 所 不 同 。 通 过 比 对 操作 系统 的 情况 ,数据 库 
管理 员 应 该 很 快 就 能 确定 你 所 管理 的 系统 的 平均 读 响应 时 间 和 操作 系统 VO 情况 的 对 应 关系 。 

检查 读 平均 响应 时 间 时 还 要 注意 几 个 问题 。 第 一 个 问题 是 在 报告 时 间 区 域内 的 IO 量 ， 如 果 
某 个 文件 在 报告 时 间 区 间 内 的 IO 数量 很 小 ， 那 么 此 平均 响应 时 间 可 能 缺乏 代表 性 ， 可 以 通过 检 
查 存放 在 相同 设备 上 的 其 他 文件 来 进一步 确认 。 另 外 一 种 情况 是 平均 每 次 读 的 数据 量 比较 多 (每 
次 读 的 块 数 比较 多 ) ， 那 么 略 高 的 平均 读 响 应 时 间 也 是 正常 的 。 下 面 的 数据 就 是 从 IO 存在 问题 
的 数据 库 上 取 下 的 STATSPACK 数据 : 


Top 5 Timed Events 






































本 $ Total 
Event Waits Time (s) Ela Time 
db file sequential read 661,802 45,404 60.79 
SQL*Net more data from dblink 3,180,371 7,894 10.57 
CPU time 58,077 6.80 
db file scattered read 56,959 3,846 5.15 
buffer busy waits 42,376 2,541 3.40 








可 以 看 出 ，db file sequential read 是 等 待 事件 的 第 一 位 事件 ， 占 整个 等 待 事件 的 60% 以 上 ， 
并 且 平 均 每 次 等 待 的 时 间 为 69ms。 这 是 一 个 典型 的 VO 存在 性 能 瓶颈 的 例子 ,通过 STATSPACK 
报告 文件 IO 性 能 分 析 数 据 ， 可 以 进一步 检查 到 底 哪 些 文件 出 现 了 问题 : 


INDEX SPACE OTHER /dev/vgl0xp/rls. 2g. vol05 
9,171 2 52.2 1.0 7,911 

















6 月 17 日 完美 的 效果 285 























/dev/vg10xp/rls_2g_vol06 

8,016 2 22.8 1.0 8,292 
/dev/vgl0xp/rilis 2g vol07 

7,567 2 9.8 1.0 8,058 
/dev/vgl0xp/ris 2g vol08 

5,456 1 46.7 1.0 6,180 
/dev/vgl0xp/ris 2g vol09 

5,925 2 57.3 1.0 6,265 
/dev/vgl0xp/ris 2g vol10 

10,426 3 147.7 Ld 6,867 
/dev/vg10xp/rls_2g_vol11 

6,071 2 130.0 1.0 5,638 
/dev/vgl10xp/rls_2g_vol12 

1,738 0 213.9 1.0 3 
/dev/vgl0xp/ris 2g voll13 

3,334 1 114.4 1.0 3,596 
/dev/vgi10xp/rls 2g vol14 

10,758 3 213.6 1.0 13,657 
/dev/vgl0xp/ris 2g voli15 

15,624 4 226.9 1.0 15,736 
/dev/vgl0xp/rils 2g voll16 

14,421 4 206.2 14:0 17,136 
/dev/vgi10xp/rls 2g vol17 

13,677 4 229.9 14.0 13,819 
/dev/vgl0xp/ris 2g vol18 

10,554 3 212.6 1.0 11,828 
/dev/vgl0xp/rilis 2g vol19 

7,510 2 200.6 1.0 9,965 
/dev/vgl0xp/rls 2g vo120 

6,134 2 198.3 1.0 7,783 
/dev/vgi10xp/rls 2g vol21 

5,753 2 217.6 1.0 839 
/dev/vgi10xp/rls 2g vol22 

4,908 1 202.3 1.0 575 
/dev/vgl0xp/rls 2g vo123 

16,341 4 236.4 1.0 6,470 





可 以 看 出 /dev/vg10xp 上 部 分 文件 的 平均 读 响应 时 间 超 过 了 200ms, 存在 严重 的 性 能 问题 。 通 
过 验证 ，/devwvg1l0xp 是 c55tl4dl 上 的 逻辑 卷 。 


& 2 优化 小 技巧 ) STATSPACK 报告 之 I/O 问题 分 析 


VO 性 能 分 析 是 STATSPACK 分 析 中 的 重要 部 分 。 对 于 VO 的 分 析 可 以 基于 两 个 方面 ， 第 一 
个 方面 是 在 Wait Events for DB 中 ， 比 如 下 面 的 数据 : 





Avg 
Total Wait wait Waits 
Event Waits Timeouts Time (s) (ms) /txn 
db file sequential read 14,409,809 0 424,347 29 93.6 
SQL*Net more data to client 1,187,033 0 8,024 7 7:7 
buffer busy waits 212,482 0 5,888 28 1.4 
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db file scattered read 143,778 0 3,154 22 0.9 

从 上 面 来 看 ，db file sequential read (29ms) 和 db file scattered read (22ms) 的 等 待 时 间 都 很 
高 ， 说 明 UO 存在 明显 的 性 能 问题 。 对 于 不 同 的 系统 ， 这 些 值 的 正常 范围 都 不 太 相 同 ， 可 以 通过 
长 期 的 积累 ， 形 成 基线 数据 。 不 过 ， 一 般 来 说 超过 10ms 就 应 该 关注 了 ， 超 过 20ms, UO 子 系统 
就 可 能 存在 问题 了 。 从 本 例 来 看 ， 系 统 的 VO 性 能 存在 一 定 的 问题 。 为 了 确定 猜测 ， 可 以 进一步 
检查 文件 IO 的 详细 信息 : 


File IO Stats for DB: HCSP Instance: hcsp Snaps: 21 -33 
-»ordered by Tablespace, File 




















Tablespace Filename 
Av Av Av Av Buffer Av Buf 
Reads Reads/s Rd(ms) Blks/Rd Writes Writes/s Waits Wt (ms) 
HAIER TEST DATA /dev/vgrac/rhaier test data02 
132 0 163.6 2.5 65 0 0 
HCSP_AT_DATA /dev/vgrac/rHCSP AI DATA 01 
1,363 0 A9 1.0 1,349 0 0 
HCSP AI INDEX /dev/vgrac/rHCSP ATI INDEX 01 
4,649 al T745 1:0 3,614 0 2 0.0 
HCSP BASE DATA /dev/vgrac/rhcsp base data01 
329,857 38 14.3 2.8 77,415 9 33,510 11.2 
HCSP BASE INDEX /dev/vgrac/rhcsp base index01 
72,557 8 14.7 140 419 0 111 3.2 
HCSP COMM DATA /dev/vgrac/rhcsp comm data01 
7,789 d. 342.4: 2.7 692 0 3,884 87.5 
从 上 面 的 数据 可 以 看 出 ， 大 多 数 的 文件 访问 的 平均 读 响应 时 间 都 超过 20ms。 基 本 上 我 们 可 
以 得 出 结论 ， 系 统 的 VO 存在 问题 。 
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CQ 
|6H18R À 准备 收工 


早上 8 点 多 和 小 齐 会 合 后 一 起 来 到 浑 南 的 省 公司 。 老 方 本 来 也 要 来 ， 只 是 被 吉林 的 事情 绊 住 
了 。 昨 天 晚上 我 和 老 于 都 没 睡 好 , 老 于 的 眼睛 红 红 的 , 我 也 一 直 打 着 哈欠 。 看 样子 小 齐 也 没 睡 好 ， 
脸色 有 点 苑 白 。 我 开玩笑 说 女孩 子 别 有 太 多 心思 , 老 得 快 。 可 能 大 家 心里 都 有 些 志 朱 ， 这 个 玩笑 
也 没有 达到 应 有 的 效果 ， 小 齐 也 只 是 朝 我 撒 撒 嘴 ， 表 示 收 到 。 走 进 会 议 室 之 前 ， 我 打 了 个 电话 给 
小 孙 ， 问 他 昨天 模块 上 线 的 情况 以 及 现在 系统 的 情况 。 小 孙 告 诉 我 ,昨天 晚上 他 们 原 计划 上 线 的 
14 个 模块 , 最 终 上 线 了 6 个 ,其 他 模块 领导 临时 决定 暂时 不 上 了 。 因 为 新 版 本 升级 后 , 这 儿 个 模 
块 要 大 改 ， 目 前 上 线 意 义 不 大 。 小 孙 不 会 监控 系统 ， 所 以 无 法 确定 系统 到 底 怎 么 样 ， 不 过 从 应 用 
那 边 看 , 几 个 应 用 系统 的 性 能 都 不 错 , 和 昨天 的 感受 差不多 。 我 让 小 孙 和 下 面 的 营业 厅 联 系 一 下 ， 
看 看 今天 的 系统 情况 ， 有 事 立 即 通 知 我 。 到 了 会 议 室 , 张 工 正在 安排 投影 ,我 看 他 的 笔记 本 通过 
无 线 连 在 DCN 网 上 ， 就 通过 张 工 的 笔记 本 连 到 服务 器 上 ， 查 看 了 3 台 服 务 器 的 状态 。 从 数据 库 
和 操作 系统 的 性 能 指标 上 看 ， 都 比 昨天 略 好 一 些 ， 看 来 昨天 上 线 的 6 个 模块 表现 还 不 错 。 大 家 看 
到 这 个 情况 ， 心 里 踏实 多 了 。 

PERERA RE, ET 10 多 分 钟 才 到 了 会 场 。 之 前 和 张 工 他 们 聊 了 聊 目 前 系统 的 情况 ， 
他 们 对 优化 效果 都 感到 比较 满意 。 张 工 问 我 系统 性 能 提升 的 比例 大 概 有 多 少 ， 是 不 是 能 够 超过 
30% 的 预期 。 我 说 现在 还 没 做 评估 ， 还 不 好 说 ， 不 过 以 我 的 经 验 ， 超 过 一 倍 应 该 没 问 题 ， 远 远 高 
于 30% 的 预期 。 孙 主任 一 到 现场 首先 向 我 们 表示 祝 货 ， 他 来 之 前 也 让 人 和 儿 个 营业 厅 确 认 过 了 ， 
今天 系统 状态 十 分 好 ， 好 儿 个 常用 模块 都 比 以 前 快 很 多 。 

今天 的 会 议 比较 正式 , 首先 老 于 向 孙 主 任 他 们 汇报 了 到 目前 为 止 所 做 的 优化 项 目 以 及 达到 的 
效果 。 然 后 开发 商 也 汇报 了 应 用 修改 的 情况 ， 按 照 开 发 商 的 统计 ， 他 们 对 我 们 提出 的 应 用 修改 ， 
已 经 100% 完 成 ， 超 过 90% 的 模块 都 已 经 上 线 ， 剩 下 没 上 线 的 是 从 业务 角度 考虑 ， 准 备 在 下 一 个 
小 版 本 升级 时 一 起 做 。 

由 于 优化 目的 基本 达到 ,所 以 这 次 小 结 会 开 得 比较 轻松 , 集团 公司 的 领导 也 通过 电话 会 议 参 
JH f We. 会 上 大 家 一 致 同意 本 次 优化 到 此 为 止 , 不 再 进行 下 一 次 微调 。 随 后 就 是 后 续 的 一 些 安 
排 。 根 据 后 面 的 安排 我 过 几 天 就 可 以 回 家 了 ， 老 于 还 要 再 观察 儿 天 ， 下 周 也 可 以 撤离 现场 。7 
月 1 日 ， 大 家 回 到 沈阳 ， 进 行 账 期 数据 的 收集 ， 以 便于 完成 最 终 的 性 能 评估 报告 。7 月 7 日 至 7 
月 10 日 进行 验收 。 随 后 安排 一 次 北方 公司 的 性 能 优化 研讨 会 ， 在 该 研讨 会 上 ， 以 沈阳 的 案例 介 
绍 系统 性 能 优化 的 方法 与 技术 ， 对 北方 公司 的 DBA 进行 一 次 全 面 的 培训 。 在 这 段 时 间 里 ， 我 们 
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需要 初步 完成 《系统 性 能 分 析 报 告 》 《系统 性 能 评估 报告 》《 优 化 方案 》 等 正式 文档 。 

会 议 结束 后 ， 我 和 老 于 先 下 楼 。 老 于 的 烟 交 又 犯 了 ， 出 了 门 马上 把 烟 点 上 。 小 齐 还 在 和 孙 主 
任 确认 一 些 事情 ， 我 们 在 楼 下 等 她 。 我 也 向 老 于 要 了 一 支 烟 点 上 ， 绷 得 很 紧 的 神经 终于 松弛 了 下 
来 。 就 这 样 结束 了 ， 心 里 放下 了 一 块 石 头 ， 反 而 觉得 空 落落 的 。 

中 午 和 小 齐 一 起 在 北 站 旁边 的 “新 洪 记 ” 吃 了 顿 饭 。 心 情 高 兴 ， 多 喝 了 几 杯 ， 下 午 就 直接 和 
老 于 一 起 回 到 酒店 。 想 着 下 午 到 中 街 去 买点 沈阳 土 特 产 。 老 于 建议 晚上 去 刘老根 大 舞台 看 场 二 人 
转 。 我 们 就 住 在 大 舞台 边 上， 一直 也 没 心思 去 看 ， 老 于 这 个 建议 马上 得 到 了 我 的 响应 。 打 了 个 电 
话 给 酒店 前 台 ， 问 问 能 不 能 帮助 订 票 。 忙 了 半天 ， 买 了 两 张 200 元 的 票 ， 原 价 180 元 的 ， 不 过 是 
二 楼 的 ， 离 舞台 比较 远 。 

今天 下 午 接 到 了 万 隆 的 李 科 长 的 电话 , 问 我 有 没有 时 间 ， 帮 他 们 的 系统 做 一 个 调 优 ,经 费 已 
经 申请 下 来 了 ， 总 共 15 万 ， 他 们 出 一 半 ， 集 成 商 出 一 半 ， 合 同 可 以 随后 走 流 程 ， 只 要 我 们 尽快 
进 场 做 就 可 以 了 。 万 隆 的 系统 问题 很 大 ， 集 成 商 在 做 软件 开发 时 底层 设计 存在 问题 ， 导 致 每 年 7 
月 、8 月 、9 月 这 3 个 月 业务 高 峰 期 时 年 年 出 问题 。 我 一 年 前 和 李 科 长 讨论 过 ， 和 希望 大 家 一 起 坐 
下 来 ,把 底层 的 应 用 架构 和 数据 字典 调整 好 , 这样 就 可 以 一 劳 永 逸 地 解决 问题 。 当 时 我 提出 的 价 
格 就 是 15 万 ， 不 过 当时 他 们 觉得 价格 太 贵 ， 没 地 方 出 这 笔 经 费 ， 这 件 事 就 作罢 了 。 没 想到 李 科 
长 还 记 着 这 个 事情 , 而 且 运 作出 了 这 个 项 目 。 经 过 一 年 的 运行 , 我 估计 万 隆 的 系统 比 一 年 前 更 加 
恶化 了 。 这 个 优化 项 目 干 不 好 ， 可 能 会 适得其反 。 而 且 沈 阳 的 项 目 刚刚 结束 ,我 也 想 好 好 休息 一 
T, 不 想 连续 去 碰 硬 骨头 ， 所 以 我 的 初步 想法 就 是 推 掉 。 不 过 李 科 长 一 副 死 绰 烂 打 的 架势 ， 搞 得 
我 也 不 好 彻底 推 掉 ， 只 是 说 先 给 我 开 个 VPN， 我 先 安排 人 上 去 看 看 ， 了 解 一 下 能 不 能 搞定 再 做 
决定 。 

放下 电话 后 ， 和 南京 的 阿 罗 联 系 了 一 下 ， 让 他 有 空 VPN 上 去 看 看 系统 的 情况 。 我 再 三 嘱 听 
阿 罗 ， 这 个 系统 问题 很 大 ， 我 们 还 没 决定 是 不 是 要 接 这 个 项 目 ， 因 此 登 上 去 后 ， 只 能 看 ， 不 能 
任何 东西 。 并 且 这 个 系统 十 分 关键 ， 千 万 不 能 出 问题 ，VPN 账号 不 要 透露 给 公司 的 其 他 人 ， 只 
有 他 一 个 人 知道 就 行 了 。 嘱 只 完 阿 罗 ， 老 于 的 电话 就 进来 了 。 两 个 人 一 起 喝 了 点 小 酒 就 去 刘老根 
大 舞台 看 二 人 转 。 小 时 候 也 经 常 听 二 人 转 ， 不 过 今天 看 赵本山 的 弟子 演出 的 二 人 转 ， 还 是 感到 十 
分 过 癌 。 演 出 刚 开始 时 报 幕 员 说 赵本山 今天 也 在 沈阳 ， 如 果 能 安排 得 开 ， 会 亲自 表演 一 个 节目 。 
虽然 最 后 由 于 时 间 错 不 开 ， 赵本山 只 是 出 面 打 了 个 招呼 就 走 了 ， 不 过 看 到 这 么 一 场 演 出 ， 感 觉 
200 块 钱 花 得 还 是 很 值 的 。 


wr 23 优 化 几 技 百 ) STATSPACK 报告 分 析 之 DB Cache2 


DB Cache 的 性 能 对 于 数据 库 的 性 能 关系 很 大 。 从 文件 头 的 信息 ,我 们 可 以 对 DB Cache 的 情 
况 有 个 初步 的 认识 : 


Instance Efficiency Percentages (Target 100%) 












































Buffer Nowait $: 99.90 Redo NoWait $: 100.00 
Buffer Hit $: 92.76 In-memory Sort $: 100.00 
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Library Hit 多 97.56 Soft Parse $: 95.07 
Execute to Parse $ 0.89 Latch Hit $: 98.33 
Parse CPU to Parse Elapsd $: 20.18 $ Non-Parse CPU: 87.69 


从 上 面 的 数据 可 以 看 到 ，Buffer Hit 的 比例 是 92.76%。 作 为 一 个 OLTP 系统 ， 这 个 命中 率 不 
算 太 高 ， 可 能 存在 DB Cache 过 小 的 问题 。 另 外 ，Buffer Nowait 的 比例 ， 是 99.9%， 虽 然 这 个 比 
例 还 是 比较 高 的 ， 不 过 在 后 面 还 是 要 关注 一 下 buffer busy waits 大 的 情况 

下 面 进一步 观察 DB Cache 的 信息 ; 


Buffer Pool Statistics for DB: BSS97 Instance: BSS97  Snaps: 40115 -40116 
-> Standard block size Pools D: default, K: keep, R: recycle 
-» Default Pools for other block sizes: 2k, 4k, 8k, 16k, 32k 


Free Write Buffer 

Number of Cache Buffer Physical Physical Buffer Complete Busy 

P Buffers Hit % Gets Reads Writes Waits Waits Waits 
D 956,500 92.8 611,070,386 44,260,765 333,301 0 1 317,535 


从 上 面 的 数据 可 以 看 到 ，Write Complete Waits 的 等 待 不 是 0， 说 明 有 会 话 在 等 待 DBWR 将 
脏 块 写 入 数据 文件 ， 然 后 释放 。 如 果 这 个 统计 值 和 Free Buffer Waits 的 值 不 是 0， 那 都 有 可 能 说 
HH DB Cache 过 小 。 另 外 要 关注 Buffer Busy Waits 的 数量 。 在 1 小 时 内 有 317 535 次 Buffer Busy 
Waits, 看 样子 这 个 系统 的 热 块 冲突 还 是 挺 严重 的 。 加 大 DB Cache 也 有 助 于 减少 Buffer Busy Waits 
的 数量 。 从 上 面 的 信息 可 以 得 出 结论 ,这 个 系统 的 DB Cache 确实 可 能 有 点 小 了 ， Ç DB 

















Cache WE? 从 Oracle 9i 开始，STATSPACK 报告 中 增加 了 Buffer Pool Advisory。 通 过 这 部 分 数据 ， 
可 以 确定 DB Cache 加 大 后 的 效果 怎么 样 : 

Size for Size Buffers for Est Physical Estimated 
P Estimate (M) Factor Estimate Read Factor Physical Reads 
D 144 1 17,865 6.76 10,064,518,738 
D 288 2 35,730 4.91 7,307,758,071 
D 432 3 53,595 4.24 6;311,657,227 
D 576 4 71,460 2.67 3,973,996,431 
D 720 5 89,325 2.32 3,449,994,052 
D 864 6 107,190 201 2,994,522,015 
D ,008 7 125,055 1.72 2,558,135,498 
D ,152 8 142,920 T90 2,229,794,150 
D ,296 9 160,785 1.27 1,891,321,676 
D ,440 0 178,650 1.08 1,602,214,384 
D ,504 0 186,590 1.00 1,488,273,940 
D , 584 T 196,515 0.80 1,184,885,252 
D ,728 T 214,380 0.70 1,046,836,171 
D ,872 2 232,245 0.63 931,974,901 
D 2,016 3 250,110 0.56 837,755,990 
D 2,160 4 267,975 0.5L 761;325;613 
D 2,304 5 285,840 0.47 695,515,934 
D 2,448 6 303,705 0.43 639,509,106 
D 2,592 7 321,570 0.39 585,920,905 





290 Oracle 优化 日 记 : 一 个 金牌 DBA 的 故事 





D 2,736 1.8 339,435 0.35 525,299,156 


目前 的 DB Cache 的 大 小 是 1 504MB, ， 如 果 目 前 系统 产生 的 物理 读 的 数量 是 1.0 的 话 ， 那 么 
DB Cache 加 大 到 1 728MB 时 ,物理 读 的 数量 会 下 降 2096, VO 减少 的 幅度 是 十 分 明显 的 .DB Cache 
增加 到 2 304MB 时 ， 物 理 读 的 数量 是 目前 的 47%, DBA 可 以 根据 目前 系统 物理 内 存 的 情况 ， 选 
择 一 个 适当 的 DB Cache 的 大 小 。 


| 本 Les 


6 月 19 日 


N 


* ORA-1591 


这 几 天 系统 状态 都 很 不 错 ， 我 们 这 个 优化 项 目 也 接近 尾声 了 。 能 够 取得 如 此 成 功 , 是 大 家 以 
前 想 都 不 敢 想 的 事情 。 老 于 这 几 天 简直 乐 开 了 花 ， 连 烟 都 少 抽 了 不 少 。 这 几 天 我 们 去 现场 的 时 间 
都 比 往常 推迟 了 , 一般 9 : 00 才 出 门 ,9 : 30 左右 到 办 公 室 , 晚上 也 早早 收工 ， 避 开 下 班 高 峰 期 。 
昨天 晚上 看 一 本 小 说 ,有 睡 得 晚 了 一 点 , 今天 我 出 门 比 平时 更 晚 ， 到 办 公 室 时 老 于 也 不 在 。 电 脑 包 
放 在 办 公 桌 上 还 没 打 开 ， 小 孙 就 说 老 于 刚 到 办 公 室 时 ， 接 了 一 个 电话 就 出 去 了 。 我 想 反 正 也 没 哈 
事情 ， 就 打开 电脑 ， 开 始 上 网 聊天 。 这 段 时 间 项 目 吃 紧 ， 连 上 QQ 聊天 的 时 间 都 少 了 。 

今天 持续 了 前 几 天 的 好 状态 ， 几 台 服 务 器 的 CPU 使 用 率 都 在 60967::5, VO 性 能 也 很 不 错 ， 
avserv 基本 上 在 几 毫 秒 。 从 小 孙 那 边 反 馈 回来 的 信息 也 不 错 ， 这 几 天 关于 性 能 的 投诉 基本 上 没有 
T, BBS 上 的 牢骚 也 少 了 不 少 。 

快 中 午时 老 于 还 没有 回来 , 我 打 了 一 个 电话 问 他 中 午 回 不 回来 , 他 说 不 回来 了 ,于 是 准备 一 
个 人 去 吃 午饭 。 刚 走 到 楼 梯 口 ， 小 孙 追 了 出 来 ， 说 :“ 老 白 ， 先 别 走 ， 系 统 出 了 个 问题 ， 帮 我 看 
S. 

我 回 到 办 公 室 ， 问 他 什么 问题 ， 小 孙 说 有 个 业务 ， 一 跑 就 报错 ， 而 其 他 业务 都 没 问题 。 我 连 
忙 查 看 了 一 下 警告 日 志 ， 发 现 警告 日 志 里 在 不 停 地 报错 : 


SMON: about to recover undo segment 119 

ORACLE Instance topcs2 (pid - 11) - Error 1591 encountered while recovering tran 
saction (119, 18) on object 2309045. 

Errors in file /u2/oracle/ora92/rdbms/log/topcs2 ora 2899.trc: 

ORA-01591: lock held by in-doubt distributed transaction 108.28.46269 

SMON: mark undo segment 119 as needs recovery 


一 看 这 个 错误 号 ORA-1591， 就 知道 这 是 典型 的 分 布 式 事务 故障 导致 的 问题 。 当 一 个 分 布 式 
事务 由 于 某 种 原因 在 prepare 阶段 出 现 故障 时 ， 会 导致 本 地 相关 的 资源 被 锁定 ， 直 到 分 布 式 事务 
被 回 退 或 者 提交 为 止 。 我 问 小 孙 故 障 出 现 前 发 生 了 什么 ,小 孙 说 刚才 银行 收费 的 接口 出 了 问题 死 
掉 了 ， 他 刚才 重启 了 这 个 程序 ， 其 他 都 正常 ， 就 是 这 个 业务 总 报错 。 

我 问 小 孙 这 个 接口 模块 是 不 是 Tuxedo 的 ， 小 孙 说 是 Tuxedo 6.5 的 应 用 。 这 种 XA 应 用 出 问 
题 导致 ORA-1591 的 问题 也 算是 常见 问题 了 ， 我 马上 查找 119 号 回 滚 段 里 是 不 是 有 死 事 务 : 


SELECT KTUXEUSN, KTUXESLT, KTUXESON, 
KTUXESTA Status, KTUXECFL Flags 
FROM x$ktuxe 
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WHERE ktuxesta!='INACTIVE' 
AND ktuxeusn-119; 


查询 结果 是 没有 任何 记录 , 我 一 看 原来 in-doubt 的 分 布 式 事务 是 108.28.46269, 于 是 马上 查询 108 
号 回 深 段 里 是 不 是 有 死 事务 : 


SELECT KTUXEUSN, KTUXESLT, KTUXESON, 
KTUXESTA Status, KTUXECFL Flags 
FROM x$ktuxe 
WHERE ktuxesta!='INACTIVE' 
AND ktuxeusn-108; 
KTUXEUSN KTUXESLT KTUXESON STATUS FLAGS 


108 28 46269 PREPARED SCO | COL | REV | DEAD 
确实 存在 一 个 PREPARED 状态 的 死 事 务 。 于 是 马上 检查 了 一 下 pending trans$E: 


SELECT local tran id, global tran fmt, global Oracle id, 
global foreign id, state, status, heuristic dflt, 
Session vector, reco vector, 
global, commit 
FROM pending trans$; 
LOCAL TRAN ID GLOBAL TRAN FMT GLOBAL ORACLE ID GLOBAL FOREIGN ID STATE STATUS 
HEURISTIC DFLT SESSION VECTOR RECO, VECTOR GLOBAL COMMIT# 








70.6.108873 306206 TOPCS.c7dd20c6.70.6.108873 forced rollback P 00000001 00000001 


1486865870 
96.42.84009 306206 TOPCS.c7dd20c6.96.42.84009 forced rollback P 00000001 00000001 
1286932454 
85.10.101067 306206 TOPCS.c7dd20c6.85.10.101067 forced rollback P 00000001 00000001 
1487167659 


9.35.29156 306206 TOPCS.c7dd20c6.9.35.29156 collecting P 00000001 00000001 1672793351 
80.8.132177 306206 TOPCS.c7dd20c6.80.8.132177 forced rollback P 00000001 00000001 
1679427495 
18.32.162778 306206 TOPCS.c7dd20c6.18.32.162778 forced commit P 00000001 00000001 
64.21.136442 306206 TOPCS.c7dd20c6.64.21.136442 forced commit P 00000001 00000001 
73.11.124822 306206 TOPCS.c7dd20c6.73.11.124822 forced rollback P 00000001 00000001 
1731227073 
63.29.148558 306206 TOPCS.c7dd20c6.63.29.148558 forced commit P 00000001 00000001 


发 现 并 不 存在 108.28.46269 这 个 事务 。 看 样子 是 系统 字典 表 出 现 问 题 了 ， 导 致 这 个 分 布 式 事务 无 
法 被 自动 回 退 。 首 先 看 看 这 个 事务 锁定 的 对 象 是 什么 : 


SELECT NAME FROM OBJ$ WHERE OBJ#=2309045; 
NAME 


TPTB IDX 
这 是 一 个 索引 ， 基 表 是 T_TPTB。 对 这 张 表 进行 全 表 扫 描 ， 看 看 会 发 生 些 什么 : 


SELECT /*+ full(a) */ count(*) FROM T TPTB a 
ORA-01591: lock held by in-doubt distributed transaction 73.11.124822 


这 张 表 被 另外 一 个 分 布 式 事务 73.11.124822 锁定 了 。 查 看 一 下 73 号 回 滚 段 的 情况 : 


SELECT KTUXEUSN, KTUXESLT, KTUXESON, 
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KTUXESTA Status, KTUXECFL Flags 
FROM x$ktuxe 
WHERE ktuxesta!-'INACTIVE' 
AND ktuxeusn-73; 
KTUXEUSN KTUXESLT KTUXESON STATUS FLAGS 


73 11 124822 PREPARED SCO|COL | REV | DEAD 


执行 ROLLBACK FORCE 73.11.124822 时 出 现 了 错误 ; 





SQL>ROLLBACK FORCE '73.11.124822' 
ERROR at line 1: 
ORA-02058: no prepared transaction found with ID 73.11.124822 


在 pending_trans$ 里 查看 目前 这 个 事务 的 状态 不 是 PREPARED, 因 此 需要 首先 在 pending 
trans$ 里 将 这 个 事务 的 状态 设置 为 prepared: 





UPDATE pending trans$SET STATE-'prepared', 
STATUS z'P' 

WHERE local tran id-'73.11.124822'; 

COMMIT; 


执行 了 这 个 语句 后 ,再 次 执行 ROLLBACK FORCE '73.11.124822 ' 还 是 报错 


SOL» ROLLBACK FORCE '73.11.124822'; 
ROLLBACK FORCE '73.11.124822' 


* 


ERROR at line 1: 
ORA-01591: lock held by in-doubt distributed transaction 108.28.46269 


看 样子 这 个 事务 被 我 们 最 初 发 现 的 那个 事务 锁 住 了 。 这 两 个 事务 一 个 锁 住 了 表 , 一 个 锁 住 了 
索引 ， 所 以 只 能 看 看 能 不 能 强制 提交 了 : 





SQL>UPDATE pending trans$ SET STATE-'prepared', 
STATUS ='P' 

where local tran id-'73.11.124822'; 

SQL>commit; 


SQL>COMMIT FORCE '73.11.124822'; 

使 用 这 个 命令 , 这 个 事务 被 成 功 地 强制 提交 了 。 下 面 来 处 理 108 回 滚 段 的 那个 事务 。 由 于 这 
个 事务 在 pending_transs$ 中 缺少 记录 ， 所 以 首先 将 这 个 事务 清理 掉 : 

SQL>exec dbms transaction.purge lost db entry( '108.28.46269' ) 


然后 手工 插入 相关 记录 : 


SQL>alter system disable distributed recovery; 
SQL>insert into pending trans$ ( 

LOCAL TRAN ID, 

GLOBAL TRAN FMT, 

GLOBAL ORACLE ID, 

STATE, 

STATUS, 

SESSION VECTOR, 

RECO VECTOR, 

TYPER, 
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FAIL TIME, 
RECO, TIME) 

values( '108.28.46269', 
306206, 
'XXXXXXX.12345.1.2.3', 
'prepared','P', 
hextoraw( '00000001' ), 
hextoraw( '00000000' ), 
0, sysdate, sysdate ); 


SQL>INSERT INTO pending sessions$ 
VALUES( '108.28.46269', 
1, hextoraw('05004F003A1500000104'), 
'C', 0, 30258592, 
146 
J 


SQL>Commit; 


然后 再 次 强制 提交 ; 


SOL» COMMIT FORCE '108.28.46269'; 





Commit complete. 


完成 提交 后 ， 小 孙 再 次 检查 了 一 下 那个 应 用 ， 发 现 问题 解决 了 。 
Fenner 


今天 老 白 处 理 的 这 个 案例 是 一 个 十 分 典型 的 分 布 式 事务 失败 导致 的 问题 。 这 类 问题 出 现 的 机 
会 很 大 ， 特 别 是 在 使 用 了 Tuxedo, CICS 和 透明 网 关 等 的 情况 下 。 如 果 碰 到 类 似 问题 ， 该 如 何 处 
HE? 老 白 在 多 年 的 工作 经 验 中 有 以 下 的 经 验 和 大 家 分 享 。 首 先 我 们 来 看 看 Oracle 官方 对 
ORA-01591 的 描述 : 


ORA-01591: "lock held by in-doubt distributed transaction %s" 

Cause: Trying to access resource that is locked by a dead 
two-phase commit transaction that is in prepared state. 

Action: DBA should query the pending trans$ and related tables, 
and attempt to repair network connection(s) to 
coordinator and commit point. If timely repair is not 
possible, DBA should contact DBA at commit point if 
known or end user for correct outcome, or use heuristic 
default if given to issue a heuristic commit or abort 
command to finalize the local portion of the 
distributed transaction. 


总 的 来 说 ，ORA-01591 的 产生 原因 是 分 布 式 事务 失败 ， 失 败 的 原因 很 多 ， 比 如 网 络 问题 、 
XA 资源 管理 器 存在 bug 等 。 一旦 分 布 式 事务 失败 ,如 果 本 地 事务 中 有 一 个 事务 正 处 于 活跃 状态 ， 
那么 该 事务 相关 的 数据 就 会 被 锁定 (无 论 读 写 都 会 被 锁定 )。 如 果 访 问 这 个 事务 关联 的 数据 ， 就 
Bik ORA-01591。 一 般 情况 下 ，ORA-01591 可 以 自动 解 开 ，SMON 会 在 一 定时 间 周 期 内 检查 
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DBA_2PC_PENDING， 找 出 需要 回 退 的 事务 ， 并 进行 自动 恢复 。 这 里 就 有 几 个 问题 ， 由 于 分 布 式 
事务 超时 判断 以 及 redo 处 理 周期 的 关系 ， 一 般 来 说 事务 自动 恢复 的 时 间 为 1 分 钟 以 上 ， 较 长 的 
可 以 达到 5 —10 分 钟 ， 这 可 能 会 对 生产 系统 造成 比较 大 的 影响 。 为 了 加 快 解锁 ， 可 以 手工 处 理 。 
这 时 可 以 使 用 ROLLBACK FORCE 或 者 COMMIT FORCE。 

有 时 候 由 于 分 布 式 事务 恢复 出 现 故障 , 会 出 现 数据 字典 不 一 致 ， 此 时 该 分 布 式 事务 就 无 法 正 
常 解除 ， 需 要 手工 干预 来 处 理 。 有 具体 的 操作 步骤 如 下 所 示 。 

(1) 检查 分 布 式 事务 的 状态 : 


SELECT LOCAL TRAN ID, GLOBAL TRAN ID, STATE, MIXED, HOST, COMMIT# 
FROM DBA, 2PC. PENDING 
WHERE LOCAL TRAN ID = ' 报 错 的 本 地 事务 号 ' 


(2) 检查 与 分 布 式 事务 相关 的 其 他 节点 的 情况 : 


SELECT LOCAL TRAN ID, IN OUT, DATABASE, INTERFACE 
FROM DBA 2PC NEIGHBORS; 


(3) 检查 本 地 回 滚 段 : 


SELECT KTUXEUSN, KTUXESLT, KTUXESON, /* 事务 号 */ 
KTUXESTA Status, 
KTUXECFL Flags 

FROM x$ktuxe 

WHERE ktuxesta!-'INACTIVE' 
AND ktuxeusn- 回 深 段 编码 


最 常见 的 情况 是 DBA_2PC_PENDING 中 存在 一 条 prepared 状态 的 记录 ,在 回 滚 段 中 也 发 现 
一 个 是 prepared 状态 的 活跃 事务 ， 但 是 事务 有 DEAD 标志 。 这 种 情况 下 ， 可 以 根据 事务 号 进行 
COMMIT FORCE 或 者 ROLLBACK FORCE 操作 。 

另外 一 种 情况 是 DBA_2PC_PENDING 中 也 有 记录 ， 但 是 状态 和 回 滚 段 中 的 状态 不 同 ， 这 时 可 
以 手工 修改 sys .pending_transs$ 中 的 状态 值 ， 然 后 再 进行 ROLLBACK FORCE/COMMIT FORCE 
操作 。 

如 果 在 DBA 2PC PENDING 中 找 不 到 记录 ， 那 么 要 检查 sys.pending transs 、 
sys.pending_sessions$fll sys.pending_sub_sessions$, 47 Rid REK, MAW LBA 
记录 ， 然 后 进行 ROLLBACK/COMMIT FORCE; 





















































insert into pending trans$ ( 
LOCAL TRAN ID, 
GLOBAL TRAN FMT, 
GLOBAL ORACLE ID, 
STATE, 
STATUS, 
SESSION VECTOR, 
RECO VECTOR, 
TYPER, 
FAIL TIME, 
RECO TIME) 
values('transid', 
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306206, 固定 值 / 

'XXXXXXX.12345.1.2.3'， 随 意 取 值 
'prepared','P', 
hextoraw( 





'00000001' ), /* 常量 
hextoraw( '00000000' ), /* 
0, sysdate, sysdate ); 


insert into pending sessions$ 























values( ' 事 务 号 '， 
1, hextoraw('05004F003A1500000104') 
"QU, 0, 30258592, "r, 
146 
); 
commit; 


表示 prepared 状态 


*/ 
E 


# 








(4) 做 完 ROLLBACK FORCE/COMMIT FORCE 后 ， 如 果 DI 





者 DBA 2PC PENDING 中 有 记录 ， 但 是 回 滚 段 中 
PENDING 中 的 记录 清除 掉 : 


ALTER session SET " smu debug mode" = 4; 


/ /如果 是 Oracle 9i, (EH AUM 需要 设置 ， 否 则 后 
commit; 








exec dbms transaction.purge lost db entry( 


我 们 实际 碰 到 的 情况 可 能 要 比 这 里 介绍 的 复杂 得 多 ， 更 详细 的 信息 可 以 参考 Metalink 文档 


401302.1。 











BA 2PC PENDING 中 的 记录 未 清除 或 
已 无 记录 ， 那 么 可 以 使 用 下 列 代码 将 DBA_2PC_ 
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(68208 À 好 奇 心 车 的 袖 


昨天 晚上 订 好 了 今天 中 午 的 航班 ， 本 来 想 早上 睡 个 懒 觉 , 不 过 不 到 8 : 00 就 醒 了 。 上 网 浏览 
了 一 下 新 闻 ， 就 下 去 吃 早餐 。 在 餐厅 刚刚 挑 了 一 盘子 点 心 ， 正在 倒 牛 奶 ， 手机 就 响 了 。 作 为 一 名 
DBA， 最 怕 的 是 半夜 手机 响 。 这 种 刚刚 上 班 时 手机 就 响 ， 我 预感 要 有 不 好 的 事情 发 生 了 。 

掏 出 手机 一 看 ,是 山东 的 电话 ， 就 知道 肯定 是 李 科 长 打 来 的 电话 。 他 焦急 地 问 我 ， 是 不 是 我 
们 昨天 晚上 做 了 什么 ， 怎 么 今天 一 上 班 ， 系 统 就 像 死 了 一 样 。 我 说 :“ 昨 晚 我 们 只 是 上 去 看 看 ， 
并 没有 操作 什么 ， 我 马上 连 上 去 看 看 吧 。” 说 完 我 马上 回 到 房间 。 路 上 我 给 阿 罗 打 了 一 个 电话 ， 
问 他 上 昨天 晚上 做 了 什么 。 阿 罗 接 电话 时 还 睡 眼 腊 胱 的， 他 告诉 我 昨天 晚上 他 上 去 分 析 了 一 下 ,发 
HAJLA SQL 执行 计划 不 正确 ， 他 觉得 对 其 中 一 张大 表 重 新 分 析 一 下 应 该 能 够 解决 问题 ， 所 以 
晚上 他 对 那 张 表 做 了 40% 采 样 的 分 析 , 并 且 对 所 有 倾斜 字段 分 析 了 柱状 图 。 那个 分 析 脚 本 到 现在 
还 没有 完成 。 通 过 和 阿 罗 的 电话 , 我 可 以 百分之百 地 确定 , 今天 早上 系统 出 现 的 问题 和 阿 罗 这 个 
分 析 是 相关 的 。 

我 马上 叫 阿 罗 停 掉 那 个 分 析 ， 然 后 我 通过 VPN 连 上 了 数据 库 。 阿 罗 做 分 析 的 那 张 表 大 概 有 
80 多 吉 字 市 ， 不 过 这 张 表 是 个 分 区 表 ， 每 个 季度 一 个 分 区 ， 表 上 面 有 11 个 索引 , 现在 是 8 : 10, 
如 果 要 在 8 : 30 全 国营 业 网 点 上 班 前 完成 分 析 ， 那 么 只 有 20 分 钟 可 用 。 我 立即 写 了 两 个 脚本 ， 
对 最 近 的 两 个 分 区 (每 个 分 区 包含 一 个 季度 的 数据 ) 做 一 个 10% 采 样 的 分 析 ， 只 分 析 表 ， 不 分 析 
索引 和 柱状 图 。8 : 27, 分 析 终 于 完成 了 。8 : 35， 系 统 的 CPU 终于 降低 到 70% 左 右 ， 系 统 基本 上 
可 以 正常 运行 了 。 看 到 系统 基本 恢复 正常 ， 我 将 剩余 的 几 个 分 区 做 了 一 个 10% 的 采样 ， 并 将 所 有 
索引 做 了 10% 的 采样 分 析 。 做 完 这 些 ， 已 经 将 近 10:00 了 。 通 过 OEM 看 到 目前 系统 十 分 繁忙 ， 
10 : 00 开始 是 业务 高 峰 , 这 个 系统 每 天 的 业务 高 峰 是 10 : OO~ 11 : 00 以 及 下 午 的 3 : 00~4 : 00, 
CPU 使 用 率 在 85% —9096, LO 繁忙 程度 在 40% 左 右 ， 物 理 内 存 使 用 率 已 经 超过 90%。 从 目前 系 
统 的 状态 看 ， 今 天 系统 不 会 有 太 大 的 问题 了 。 

我 马上 给 李 科 长 打 了 个 电话 ， 说 从 目前 情况 看 ， 今 天 应 该 没 问题 ， 今 天 晚上 我 会 把 这 张 表 重 
新 分 析 一 下 ， 整 个 分 析 过 程 会 在 凌晨 开始 做 ， 四 五 点 钟 结束 ， 应 该 是 比较 安全 的 。 我 说 的 过 程 中 ， 
李 科 长 一 句 话 也 没有 说 。 等 我 说 完 ， 李 科 长 说 :“ 老 白 ， 这 回 你 的 弟兄 给 我 捅 了 这 么 大 一 个 签 子 ， 
你 就 别 想 跑 了 。 优 化 这 件 事 ,， 你 必须 接 下 来 ,否则 今天 早上 这 件 事 , 我 就 可 以 让 公司 给 你 发 律师 函 
让 你 赔偿 。” 我 说 :“ 李 科 长 ， 我 们 也 算 老 朋友 了 ， 不 能 这 么 无 耻 吧 ， 你 们 这 个 系统 优化 风险 太 大 ， 
好 多 团队 都 不 肯 接 你 这 个 活 。 最 近 我 们 接 了 几 个 难 哨 的 骨头 ， 短 时 实在 是 没 精力 来 干 这 个 活 了 ”。 
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说 实在 的 , 如 果 不 是 沈阳 的 事情 还 没有 完全 结束 , 我 还 是 很 想 做 李 科 长 这 个 项 目的 。 这 种 优 
化 项 目 非常 具有 挑战 性 。 不 过 ， 目 前 这 个 项 目的 风险 指数 十 分 高 ， 如 果真 要 做 ,肯定 要 全 力 投 入 
才 行 。 而 且 时 间 也 十 分 紧迫 ， 离 下 个 月 的 业务 高 峰 只 有 不 到 半 个 月 的 时 间 ， 要 在 这 么 短 时 间 内 有 
所 作为 ， 难 度 确 实 比 较 大 。 这 个 系统 是 全 国 性 的 服务 系统 ,一 旦 出 现 问 题 ， 后 果 十 分 严重 。 就 算 
我 这 个 比较 爱 涉 险 的 人 ， 对 这 个 活 也 不 敢 轻 易 答 应 。 

李 科 长 这 回 仍 旧 像 牛皮 糖 一 样 难以 甩 掉 , 无 奈 之 中 我 只 好 答应 接 下 这 个 活 , 但 是 我 说 不 能 保 
证 在 这 段 时 间 全 部 投入 到 这 个 项 目 中 , 因为 沈阳 那 边 还 有 一 个 研讨 会 , 大 概 会 占用 我 一 周 的 时 间 。 
李 科 长 马上 说 :“ 没 关系 ， 你 不 能 到 现场 ， 远 程 关注 一 下 就 行 ， 你 把 老 能 派 过 来 就 行 了 。 ARR 
本 还 有 别 的 事情 ， 暂 时 无 法 脱身 ， 被 李 科 长 这 么 一 说 ， 也 就 没 办 法 了 。 李 科 长 听 到 了 我 的 承诺 ， 
心满意足 地 放下 了 电话 ， 我 却 又 要 头疼 了 ,， 老 能 被 李 科 长 抢 过 去 了 ， 他 的 缺 怎 么 补 呢 ? 算 了 , 走 
一 步 算 一 步 吧 。 

放下 电话 , 先 给 老 能 去 了 个 电话 , 让 他 准备 准备 , 明天 就 出 发 。 想 到 阿 罗 今 天 捅 的 这 个 繁 子 ， 
气 不 打 一 处 来 ， 立 即 打 电话 给 阿 罗 。 阿 罗 已 经 知道 自己 今天 捅 了 个 小 竹子 ， 所 以 一 接 电话 就 说 : 
“ 老 白 ， 又 给 你 添 麻烦 了 。” 我 说 :“ 麻 烦 不 是 一 般 的 大 ， 李 科 长 这 种 人 是 招 车 得 起 的 吗 。 对 于 这 
个 项 目 ， 本 来 我 的 想法 是 能 推 就 推 ， 大 不 了 给 他 提 儿 条 免费 建议 就 完了 ,这 回 被 他 粘 上 了 。 你 也 
算 个 老 DBA 了 ， 铁 的 纪律 都 能 违反 ? ” 

阿 罗 也 是 一 肚子 委 届 ,他 也 知道 这 个 系统 不 能 轻易 动手 , 不 过 昨天 晚上 他 分 析 了 半夜 ， 觉 得 
自己 已 经 找到 了 问题 的 根源 ,分 析 一 下 表 ， 可 能 就 搞定 了 ， 所 以 他 禁不住 诱惑 ， 做 了 那个 操作 。 
我 以 前 就 和 阿 罗 说 过 ， 他 最 大 的 毛病 是 好 奇 心太 强 ， 作 为 一 名 DBA， 这 是 十 分 致命 的 。 作 为 一 
名 DBA， 最 本 分 的 做 法 是 只 做 分 内 的 事情 ， 其 他 的 能 不 做 尽量 不 做 ， 特 别 是 没有 百分之百 把 握 
的 事情 。 以 往 的 经 验证 明 ， 经 不 住 诱惑 时 做 的 操作 绝 大 多 数 都 会 导致 严重 的 后 果 。 

一 个 不 经 意 的 操作 把 公司 这 段 时 间 的 安排 全 部 打 乱 了 。 不 过 阿 罗 已 经 方寸 大 乱 , 这 个 时 候 也 
是 多 说 无 益 。 我 和 他 通电 话 时 夸大 这 个 问题 的 严重 性 ， 目 的 也 是 想 让 阿 罗 长 点 记性 ， 不 要 再 犯 类 
似 的 错误 。 虽 然 被 迫 接 下 了 这 个 优化 项 目 ， 不 过 有 活 干 也 不 是 件 环 事 ， 其 他 的 项 目 安排 我 只 能 另 
外 想 办 法 了 。 

被 这 件 事 折腾 了 一 上 午 , 原本 到 中 街 买 点 土 特产 的 计划 也 就 泡汤 了 。 匆匆 忙 忙 退 了 房 , TT 
个 车 就 直 奔 机 场 。 看 样子 最 近 又 要 跑 一 趟 山东 了 。 


E 人 优化 小 技巧 ) STATSPACK 报告 分 析 之 共享 池 分 析 
对 共享 池 的 分 析 首 先 应 该 从 Load Profile 开始 : 


Load Profile 


















































ttt tested Per Second Per Transaction 
Redo size: 466,915.94 61,799.72 

Logical reads: 30,110.84 3,985.39 

Block changes: 185.44 24.54 


Physical reads: 1,682.72 222.72 
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Physical writes: 179.06 23.70 
User calls: 261.34 34.59 
Parses: 90.72 12.01 
Hard parses: 18.04 2.39 
Sorts: 9.48 1.26 
Logons: 1.18 0.16 
Executes: 102.75 13.60 
Transactions: 7.56 
$ Blocks changed per Read: 0.62 Recursive Call $: 35495 
Rollback per transaction $: 5.48 Rows per Sort: 2737.16 


Instance Efficiency Percentages (Target 100%) 


Buffer Nowait % 99.94 Redo NoWait $: 100.00 

Buffer Hit $: 94.77 In-memory Sort $: 99.97 

Library Hit 96s 93.73 Soft Parse %: 80.11 

Execute to Parse %: 11.70 Latch Hit $: 99.77 

Parse CPU to Parse Elapsd %: 62.93 % Non-Parse CPU: 97.97 


Shared Pool Statistics Begin End 


Memory Usage %: 86.38 89.00 
% SQL with executions>1: 45.76 46.74 
% Memory for SQL w/exec>1: 60.07 57.53 


上 面 加 粗 的 内 容 都 是 和 共享 池 有 关 的 。 从 上 面 的 数据 看 ， 每 秒 Parses 的 数量 是 90.72， 其 中 
Hard parses 的 数量 是 18.04, Soft Parse 的 比例 为 80.11%， 说 明 系 统 的 硬 分 析 较 为 严重 ， 对 共享 池 
的 压力 较 大 。 从 Library Hit 来 看 ，93.73% 的 命中 率 对 于 一 个 OLIP 系统 来 说 还 是 略 低 一 些 。 从 这 
些 统计 数据 来 看 ,这 个 系统 可 能 存在 一 定 共享 池 问 题 。 在 后 面 的 报告 中 我 们 需要 仔细 分 析 。 通 过 
门 锁 情 况 ， 也 可 以 看 出 共享 池 是 否 存在 问题 : 








Pct Avg Wait Pct 

Get Get Slps Time NoWait NoWait 

Latch Requests Miss /Miss (s) Requests Miss 

library cache 3,937,180 54.1 0.0 4 121,176 0.5 
library cache load lock 538 0.0 0 0 
library cache pin 1,731,246 0.4 0.0 0 0 
library cache pin alloca 1,166,244 0.1 0.0 0 0 
row cache enqueue latch 4,330,937 0:3 0.0 0 0 

row cache objects 4,379,188 0.2 0.0 0 39 0.0 
shared pool 2,218,835 0.5 0.0 0 0 


从 上 面 的 数据 可 以 看 出 ，library cache 门 锁 的 丢失 率 比 较 高 ， 这 和 硬 分 析 较 高 有 关 ， 但 不 能 
说 明 共 享 池 就 过 小 ， 因 为 row cache 和 shared pool 相关 的 门 锁 丢 失 率 在 正常 的 范围 。 可 以 继续 查 
看 共享 池 的 相关 信息 : 


Dictionary Cache Stats for DB: NEVA2DB Instance: neva2db Snaps: 18596 -18597 
-»"Pct Misses" should be very low (< 2% in most cases) 

->"Cache Usage" is the number of cache entries being used 

->"Pct SGA" is the ratio of usage to allocated size for that cache 
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Get Pct Scan Pct Mod Final 
Cache Requests Miss Reqs Miss Reqs Usage 
dc, constraints 195 34.9 0 195 6 
dc, files 4,752 0.0 0 0 176 
dc histogram defs 249,043 0.1 0 0 6,728 
dc object ids 1,071,024 0.0 0 21 817 
dc, objects 152,381 0.4 0 68 1,325 
dc profiles 2,118 0.0 0 0 1 
dc rollback segments 10,538 0.0 0 0 171 
dc segments 303,970 0.0 0 3,857 1,387 
dc sequences 333 0.0 0 333 12 
dc_table_scns 19 100.0 0 0 0 
dc. tablespace quotas 1,626 0.1 0 1,626 9 
dc. tablespaces 154,730 0.0 0 0 151 
dc_user_grants 18,339 0.0 0 0 13 
dc usernames 54,441 0.0 0 0 II 
dc users 164,074 0.0 0 0 14 


Library Cache Activity for DB: NEVA2DB Instance: neva2db Snaps: 18596 -18597 
->"Pct Misses" should be very low 


Get Pct Pin Pct Invali- 
Namespace Requests Miss Requests Miss Reloads dations 
BODY 367 0.0 367 0.3 1 0 
CLUSTER 163 0.0 178 0.0 0 0 
INDEX 346 1.2 282 1.4 0 0 
SQL AREA 163,152 19.3 590,480 10.9 849 70 
TABLE/PROCEDURE 159,959 0.1 441,195 0.1 55 0 
TRIGGER 2,848 0.0 2,848 0.0 0 0 





SQL AREA 的 丢失 率 是 19.3, 其 他 都 很 正常 。SQL AREA 的 丢失 率 较 大 和 硬 分 析 比 例 较 高 
Ro 一 般 来 说 ,， SQLAERA 的 丢失 率 在 20% 以 内 都 是 可 以 接受 的 。 下 面 我 们 继续 查看 Shared Pool 
Advisory: 


Shared Pool SP Estd Estd Estd Lib LC Time 
Size for Size Lib Cache Lib Cache Cache Time Saved Estd Lib Cache 
Estim (M) Factr Size (M) Mem Obj Saved (s) Factr Mem Obj Hits 
912 .6 804 105,936 4,768,878 L.0 326,665,094 
1,072 ET 964 125,874 4,768,910 L.0 326,693,626 
1,232 .8 1,124 150,371 4,768,938 L.0 326,717,820 
1,392 .9 1,284 175,241 4,768,967 L.0 326,742,860 
1,552 1.0 1,442 197,493 14,768,991 1.0 326,765,091 
1,712 A 1,601 218,503 14,769,010 14.0 326,781,693 
1,872 1.2 1,760 239,872 4,769,028 1.0 326,796,532 
2,032 1.3 1,919 261,536 4,769,040 1.0 326,808,261 
2,192 1.4 2,078 283,180 4,769,051 1.0 326,819,047 
2,352 1.5 2,237 305,581 4,769,064 1.0 326,831,187 
2,512 1.6 2,396 325,251 4,769,080 L.0 326,845,940 
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2,672 1237 27556 342,048 14,769,097 1.0 326,861,145 
2,832 1.8 2,715 358,349 14,769,115 1.0 326,875,825 
2,992 1.9 2,874 374,365 14,769,133 1.0 326,891,217 
34152 2.0 2,975 385,473 14,769,151 1.0 326,906,085 


从 上 面 的 图 表 来 看 ， 目 前 的 共享 池 大 小 为 1 552MB, ， 可 以 容纳 的 对 象 数量 是 326 765 091, 
加 大 共享 池 后 ， 容 纳 对 象 的 数量 增加 有 限 。 从 上 面 的 分 析 可 以 知道 ,虽然 库 Cache 的 命中 率 不 足 
95%， 但 是 这 主要 由 SQL 硬 分 析 较 为 严重 导致 ， 和 应 用 有 关 ， 简 单 地 通过 加 大 共享 池 的 大 小 作 
用 不 大 。 
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算 起 来 离开 沈阳 一 个 月 了 ，6 月 下 旬 离 开 沈阳 时 ， 优 化 实施 的 主体 工作 已 经 结束 ， 只 剩 下 部 
分 SQL 还 没有 上 线 。 索 引 重建 的 工作 我 们 安排 在 6 月 底 账 期 开始 之 前 进行 ， 由 留守 的 老 于 编写 
了 一 组 存储 过 程 , 交 给 小 孙 实 施 。 这 个 索引 重建 工作 和 表 分 析 工 作 已 经 成 为 日 常 维护 的 常规 项 目 ， 
正式 写 入 了 开发 商 的 维护 工作 指导 书 中 , 现场 的 应 用 维护 人 员 会 根据 这 个 指导 书 , 在 固定 的 时 间 
实施 这 些 操 作 。 

项 目 后 期 我 们 就 没有 再 去 沈阳 了 ， 因 为 自从 6 H 20 号 大 批 SQL 上 线 后 ，3 套 系 统 的 性 能 都 
有 了 很 大 幅度 的 提升 ， 资 源 紧张 的 情况 大 大 缓解 ，CPU、LIO 、 内 存 都 处 于 比较 安全 的 范围 ， 系 
统 响 应 时 间 提 升 都 超过 了 一 倍 ， 系统 总 的 否 吐 量 也 有 了 较 大 幅度 的 提高 。 从 全 省 各 个 营业 厅 的 反 
馈 情 况 来 看 ， 营 业 前 台 对 系统 性 能 的 改善 也 十 分 认可 。6 月 底 的 账 务 处 理 异 常 顺利 ， 经 过 优化 后 
的 账 务 处 理 程序 ， 性 能 普遍 提高 了 数 倍 。 因 此 ，6 月 底 的 账 务 处 理 耗 时 比 平时 缩短 了 一 倍 以 上 ， 
对 此 全 部 和 业务 主管 部 门 都 比较 满意 。 

7 月 初时 ， 老 于 给 我 发 来 了 完整 版 本 的 《系统 性 能 评估 手册 》， 邮 件 正 文 只 有 胜 过 千言 万 语 
的 4 个 字 “ 不 辱 使 命 "。 我 理解 老 于 发 这 封 邮件 时 兴奋 的 心情 ， 这 种 心情 只 能 用 这 4 个 字 来 表达 。 
于 是 我 迫不及待 地 打开 附件 ， 想 看 看 我 们 到 底 创造 了 一 个 什么 样 的 奇迹 ， 具 体 如 下 表 所 示 。 













































































































































































性 能 指标 调整 前 调整 后 对 比 说 明 
平均 每 事务 响应 时 间 减 少 ; 
响应 时 间 / 事 务 3 867.39 1 000.74 系统 响应 速度 加 快 ， 
说 明 系 统 总 体 性 能 提高 3.87 倍 
: 平均 每 事务 消耗 的 CPU 时 间 缩 短 ; 
CPU 时 间 / 事 务 2 125.48 355.36 ities 
事务 处 理 速度 提高 
平均 每 事务 的 等 待 事件 时 间 减 少 ; 
等 待 时 间 /事务 1741.91 645.38 DAE ae 
系统 等 待 时 间 降 低 ， 性 能 提高 
物理 磁盘 读 减 少 
物理 读 / 秒 1113.86 996.91 id MER 
磁盘 IO 降低 ， 系 统 性 能 提高 
事务 数 / 秒 8 461 10 426 事务 量 高 于 调整 前 ， 系 统 负载 提高 
redo size/ 秒 12 807.29 25 323.94 每 秒 及 每 事务 产生 的 redo 大 于 调整 前 ， 说 明 系 
redo size/ 事 务 5 450.78 8 746.55 统 负载 及 事务 大 小 均 高 于 优化 前 














从 评估 报告 上 可 以 很 清晰 地 看 到 ， 系 统 响 应 时 间 提 升 了 3.87 倍 ， 这 在 营业 前 台 会 有 明显 的 
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感受 ， 这 是 最 终 用 户 真实 感受 的 反映 。 从 每 个 事务 的 CPU 消耗 来 看 ， 这 部 分 的 提升 尤为 明显 ， 
这 部 分 成 果 主要 来 自 于 SQL 优化 以 及 表 分 区 、 索 引 重 建 等 动作 的 效果 。 每 个 事务 的 等 待 时 间 也 
有 了 明显 的 减少 , 这 是 数据 库 整 体 性 能 提升 的 体现 。 上 面 这 些 数 据 确实 是 我 在 两 个 月 前 想 都 不 敢 
想 的 ,我 们 居然 取得 了 这 人 么 辉煌 的 成 功 。 最 终 能 够 获得 这 么 漂亮 的 数据 ， 和 开发 商 最 后 阶段 的 成 
果 是 分 不 开 的 。 如 果 不 是 最 后 关头 那些 SQL 上 线 ， 我 们 也 许 能 够 获得 30% 一 50% 的 性 能 提升 。 
想起 来 我 和 孙 主 任 演 的 那 出 双簧 的 作用 还 是 巨大 的 。 

验收 那天 老 于 喝 得 大 醇 ， 最 后 是 被 张 工 他 们 抬 回 酒店 的 。 实 际 上 验收 工作 很 简单 ， 老 于 在 7 
月 初 账 期 后 回 家 休息 了 儿 天 ， 回 到 沈阳 时 小 齐 就 希望 老 于 能 够 在 15 日 之 前 完成 验收 工作 。 当 老 
于 志 起 不 安 地 向 孙 主 任 提 出 验收 请 求 时 , 没 想 到 孙 主 任 异 常 爽快 , 他 说 :“ 验 收 只 是 个 形式 而 已 ， 
这 大 半 个 月 系统 表现 这 么 好 , 就 是 最 好 的 验收 ,优化 这 种 项 目 , 谁 说 了 都 不 算 , 系统 说 了 才 算 数 。 
你 明天 把 验收 所 需要 的 材料 带 过 来 , 我 签 个 字 就 算 验 收 了 吧 。 不 过 正式 盖 章 还 需要 儿 天 , 这 是 公 
司 的 流程 ， 我 也 没 办 法 。” 

后 来 听 张 工 说 ,签字 那天 ， 老 于 被 张 工 他 们 放 倒 了 ， 实 际 上 也 是 老 于 自己 把 自己 放 倒 的 。 酒 
是 在 滑翔 小 区 边 上 的 “海鲜 大 排档 ” 喝 的 ， 开 始 喝 啤酒 ， 后 来 啤酒 不 过 疗 了， 就 喝 上 二 锅 头 了 。 
大 家 都 喝 好 了 准备 撤 的 时 候 ， 老 于 又 突然 提出 去 K 歌 ， 最 后 在 KTV， 老 于 终于 倒 下 了 。 这 是 一 
种 宣泄 ,一 种 快乐 的 宣泄 。 每 个 人 都 有 宣泄 的 方式 ， 和 老 于 不 同 , 我 在 一 个 大 项 目 结束 时 ， 喜欢 
一 个 人 独自 坐 坐 ， 稍 微 喝 点 红酒 。 

我 把 老 于 的 邮件 转 给 了 老 熊 ， 老 能 说 老 于 已 经 和 他 通过 电话 了 ,他 听 说 后 也 很 兴奋 ， 只 是 没 
赶 上 那 顿 酒 ， 有 点 遗憾 。 我 说 就 是 你 去 了 也 是 白 给 ,沈阳 的 哥们 喝酒 和 南方 人 不 一 样 ， 基 本 上 是 
去 一 个 放 倒 一 个 。 

昨天 小 齐 打 电话 来 说 ，21 日 开始 准备 在 沈阳 开 一 个 “系统 性 能 优化 研讨 会 ”， 邀 请 了 北方 公 
司 各 省 的 技术 人 员 参 加 。 会 议 地 址 安排 在 风景 秀丽 的 棋盘 山 度假 区 , 主要 活动 包括 项 目 总 结 和 技 
术 培 训 。 老 于 负责 讲 “Oracle 数据 库 管理 *”， 我 负责 讲 “Oracle 数据 库 性 能 优化 实战 技术 ”。 课 程 
内 容 我 早 就 提交 给 小 齐 了 ,小 齐 和 北方 公司 研究 后 觉得 我 的 讲义 里 理论 部 分 过 多 , 因为 参加 活动 
的 技术 人 员 水 平 参差 不 齐 ， 所 以 建议 我 降低 难度 ， 并 且 增 加 更 多 实战 内 容 ， 最 好 把 我 们 在 沈阳 做 
项 目的 案例 抒 到 课程 里 ， 用 实际 案例 来 替代 高 深 的 理论 。 

今天 一 下 飞机 ， 就 接 到 了 小 齐 的 短信 ， 她 已 经 在 机 场 了 , 会 务 组 准备 了 一 辆 中 巴 车 , 我 正好 
能 够 赶 上 ,否则 自己 一 个 人 去 那里 还 真有 点 不 好 找 。 棋 盘山 度假 区 位 于 沈阳 市 的 水 源 地 棋盘 山水 
库 腹 地 ， 虽 然 在 沈阳 生活 过 10 年 ， 但 那个 地 方 我 还 是 头 一 次 去 。 进 了 棋盘 山 风 景区 的 大 门 ， 汽 
车 又 治 着 水 库 跑 了 差不多 20 分 钟 才 来 到 我 们 下 枫 的 酒店 。 棋盘 山里 面 的 酒店 都 是 临 湖 青山 而 建 ， 
治 着 山坡 一 片 不 高 的 房子 ， 给 人 感觉 很 舒服 。 

大 家 位 着 签到 领 礼品 ， 我 看 了 一 下 礼品 ， 里 面 有 一 套 迷 你 音箱 不 错 ， 就 要 了 一 套 迷 你 音箱 和 
一 套 修 甲 器 。 接 待 的 小 妹妹 笑 着 对 我 说 :“ 你 肯定 是 个 好 丈夫 。 我 说 为 什么 ， 她 说 我 是 第 一 个 选 
择 修 甲 器 的 男士 , 领 礼品 还 想 着 老婆 的 男人 肯定 是 个 好 丈夫 。 想 想 也 是 ,无 意 之 中 就 做 了 一 次 好 
丈夫 ， 看 样子 我 从 骨子里 来 说 还 是 个 不 错 的 老公 ， 回 家 要 给 老婆 好 好 宣扬 宣扬 。 我 在 来 宾 签 到 表 
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上 看 到 了 老 于 的 名 字 ， 就 让 负责 接待 的 小 妹妹 把 我 和 老 于 安排 在 一 个 房间 。 一 个 多 月 不 见 了 ,很 
想 和 老 于 聊 聊 。 

找 老 于 的 房间 其 实 很 容易 ， 闻 着 烟 味 就 可 以 找到 了 。 我 在 房 门口 就 闻 到 了 一 股 浓烈 的 烟 味 ， 
看 样子 老 于 正在 房间 里 。 虽 然 开 着 窗 ， 屋 里 的 烟 味 还 是 很 浓 ， 老 于 正 坐 在 床上 喷 云 吐 雾 。 

我 说 老 于 ， 我 们 还 是 到 湖 边 坐 坐 吧 ， 这 里 烟 味 大 浓 ， 受 不 了 。 我 和 老 于 一 起 坐 在 湖 边 ， 一 边 
抽烟 一 边 听 老 于 介绍 我 走 后 的 一 些 事情 。 后 来 开发 商 配合 得 相当 到 位 ， 我 们 提出 的 儿 十 个 SQL 
最 后 大 多 数 都 上 线 了 ， 范 总 后 来 又 来 了 一 次 。 孙 主任 请 老 于 和 范 总 一 起 吃 了 顿 饭 ， 饭 桌 上 孙 主 任 
把 我 们 当时 算计 他 的 事情 挑 明了 。 范 总 说 其 实 他 也 早 就 回 过 味 来 了 ,这 件 事 肯定 是 个 套 ， 不 过 这 
个 套 他 是 自愿 往 里 外 的 ， 因 为 这 件 事 是 多 赢 的 事情 ， 设 理由 不 接受 。 孙 主任 和 范 总 都 是 海量 ， 最 
后 大 家 尽 欢 而 散 。 


E SMENE) 如 何 评估 优化 效果 


优化 效果 的 评估 不 仅仅 是 优化 实施 者 交差 的 手段 。 作 为 一 个 实施 优化 项 目的 人 , 在 项 目的 每 
个 阶段 都 需要 去 对 优化 效果 进行 评估 , 以便 确定 目前 的 优化 是 否 达到 了 预期 的 目标 , 是 否 需要 继 
续 优化 下 去 。 如 果 是 优化 某 个 SQL， 那 么 这 个 SQL 的 优化 效果 是 很 容易 评估 的 ， 因 为 从 SQL 的 
执行 开销 到 SQL 的 响应 时 间 ， 都 很 容易 获得 。 而 如 果 针 对 一 个 系统 优化 的 项 目 ， 优 化 效果 的 评 
佑 就 不 那么 简单 了 。 曾 经 有 多 个 客户 问 我 ,优化 后 如 何 对 结果 进行 评估 呢 ? 经 常 有 人 帮 有 我 们 做 了 
优化 ,而 且 优 化 后 他 们 提交 的 评估 数据 都 很 漂亮 , 但 是 从 业务 部 门 得 到 的 反馈 和 那些 数据 根本 对 
不 上 。 

确实 评估 优化 效果 最 好 的 方法 是 最 终 用 户 的 反馈 , 不 过 用 户 的 反馈 也 不 是 绝对 的 ,因为 优化 
的 目的 有 很 多 种 , 虽然 说 绝 大 多 数 系统 优化 的 目的 是 提高 系统 的 响应 时 间 , 不 过 我 们 不 应 该 忘记 ， 
还 有 一 些 优化 的 目的 可 能 是 提高 系统 整体 的 吞吐 能 力 。 在 这 种 情况 下 ,响应 时 间 并 不 是 评估 优化 
效果 的 最 重要 依据 。 因 此 针对 不 同 的 优化 项 目 ， 优 化 评估 的 出 发 点 是 不 同 的 。 

虽然 我 们 希望 展现 给 最 终 客户 的 评估 数据 很 漂亮 , 在 选取 评估 数据 时 我 们 会 尽 可 能 选取 漂亮 
一 些 的 数据 写 在 报告 里 , 但 是 作为 优化 的 实施 者 , 必须 清楚 地 认识 到 从 事 的 优化 工作 的 真实 效果 ， 
我 们 需要 做 的 是 让 用 户 真 正 认可 我 们 的 优化 效果 ， 而 不 是 验收 后 客户 又 三 番 五 次 地 找 你 的 麻烦 。 
与 找到 系统 存在 的 问题 相 比 ， 预 估 和 评估 优化 的 效果 是 更 难 的 事情 。 
评估 性 能 的 提升 首先 需要 从 系统 资源 的 情况 来 分 析 。 优 化 实施 后 ， 任 何 一 种 资源 使 用 情况 
必须 在 合理 的 范围 内 ， 如 果 优 化 后 某 个 系统 资源 处 于 危险 状态 ， 则 说 明 这 次 优化 存在 问题 ， 必 
须 继 续 优化 ， 使 资源 使 用 更 加 合理 。 我 们 可 以 在 优化 前 后 采集 操作 系统 CPU, VO 或 内 存 的 使 
用 情况 ,进行 对 比 。 比 如 从 下 面 的 两 个 图 表 来 看 , 7 月 19 日 在 业务 高 峰 期 间 9 : 10~10 : 10 和 
15 :10—16 : 10, 系统 比较 平稳 ，CPU 空闲 的 比例 超过 了 30%, 而 5 月 19 日 优化 前 CPU 的 空闲 
比例 小 于 10%。 
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5 月 19 日 CPU 使 用 情况 





一 一 用 户 
-所 系统 
空间 


IO 等 待 





7 月 19 日 CPU 使 用 情况 


一 上 用户 





AK 
空闲 


LO 等 待 








除了 资源 使 用 情况 的 比较 外 ， 从 STATSPACK (或 者 AWR) 报告 中 ， 可 以 提取 出 一 些 很 有 
代表 性 的 指标 。 这 些 指标 具有 一 定 的 可 比 性 。 从 事务 响应 时 间 、 每 秒 事 务 数 、 每 秒 逻辑 读 、 每 
秒 物理 读 的 数量 等 指标 ， 都 可 以 看 出 系统 性 能 是 否 有 所 提升 。 由 于 每 个 应 用 系统 在 较 短 的 时 间 
区 间 内 的 特点 (我们 经 常 说 的 系统 的 节奏 ) 是 不 会 变 的 ， 所 以 多 个 STATSPACK 报告 的 数据 是 
可 比 的 。 不 过 为 了 能 够 获得 更 为 准确 的 比 对 数据 ， 需 要 选取 两 个 业务 相 类 似 的 报告 进行 比 对 。 
如 何 确定 两 份 报告 之 间 的 业务 相 类 似 呢 ? 如 果 可 能 的 话 ， 最 好 能 够 和 开发 部 门 或 者 业务 部 门 的 
人 一 起 来 确定 。 比 如 ， 每 个 月 中 一 套 系统 在 不 同时 间 段 内 跑 的 应 用 的 特点 可 能 略 有 不 同 ， 如 很 
多 运营 商 系 统 每 个 月 底 都 会 忙 一 些 ， 月 中 时 会 内 一 些 ， 周 末 相 对 来 说 业务 会 少 一 些 ， 平 时 业务 
更 人 一些 ， 等 等 。 在 每 一 天 当中 ， 系 统 也 是 有 一 定 节奏 的 ， 比 如 每 天 早上 9 :00—10:00 ZEE 
较 忙 ,下 午 3 : 00~4 : 00 会 比较 忙 , 下 午 5 : 30~6 : 30 由 于 很 多 营业 员 扎 账 ， 可 能 导致 系统 负 
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载 较 大 ， 等 等 。 在 掌握 了 系统 的 节奏 后 ， 我 们 很 容易 就 能 找 出 可 比 对 的 报告 ， 并 对 系统 的 优化 情 
况 进 行 比 对 。 因 为 优化 不 可 能 面面俱到 ,所 以 在 不 同 的 采样 点 的 比 对 结果 可 能 不 同 ， 有 可 能 从 每 
天 业务 高 峰 期 间 的 比较 来 看 ， 系 统 性 能 提升 很 大 ,但 是 如 果 比 对 扎 账 期 间 ,， 性 能 提升 可 能 不 是 特 
别 明 显 ， 因 为 扎 账 时 的 应 用 可 能 没有 进行 过 优化 。 实 际 上 ， 最终 写 在 报告 里 的 评估 值 并 不 是 最 重 
要 的 。 如 果 客 户 认可 你 的 优化 效果 , 那么 报告 里 写 什 么 样 的 值 客户 都 可 以 认可 ， 反 过 来 客户 如 果 
不 认可 优化 效果 ， 你 就 是 把 报告 写 得 再 好 客户 也 无 法 给 你 验收 。 

除了 今天 我 们 看 到 的 那个 比 对 结果 外 , 很 多 其 他 方面 的 指标 也 可 以 进行 比 对 , 比如 下 图 所 示 。 











优化 前 后 大 表 全 扫描 对 比 





国 5 月 份 大 表 全 扫描 
国 7 月 份 大 表 全 扫描 





xx 
= 
i 
4 
R 
2 








对 于 一 个 大 表 扫 描 十 分 严重 的 系统 , 我 们 如 果 要 对 应 用 进行 优化 , 那么 评估 应 用 优化 效果 的 
一 个 重要 指标 是 每 秒 大 表 全 表 扫 描 的 数量 。 从 上 面 的 图 中 可 以 看 出 , 优化 后 大 表 的 全 表 扫 描 下 降 
的 幅度 还 是 很 明显 的 ， 说 明 应 用 优化 起 到 了 很 好 的 效果 。 


E^ (fiftijáI8) STATSPACK 报告 分 析 之 undo 分 析 

STATSPACK 报告 中 关于 undo 分 析 的 信息 十 分 丰富 。 对 于 自动 undo 管理 (AUM) 来 说 , undo 
需要 调整 的 内 容 并 不 多 ， 主 要 是 undo retetion 和 undo 表 空 间 的 管理 。 从 STATSPACK 报告 上 ， 
首先 我 们 要 分 析 undo 段 的 总 体 情况 : 








Trans Table Pct Undo Bytes 
RBS No Gets Waits Written Wraps  Shrinks  Extends 
0 33,936.0 0.00 0 0 0 0 
1 2,200.0 0.00 0 0 0 0 
2 40,418.0 0.04 21,805,550 8 0 3 
3 33,175.0 0.02 20,182,728 3 0 0 
4 20,464.0 0.02 8,400,968 ï 0 0 
5 19,714.0 0.03 11,173,194 4 al 0 
6 24,956.0 0.02 9,347,378 3 0 0 
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7 81,818.0 0.02 196,187,192 55 0 47 
8 69,053.0 0.01 173,691,704 37 5 30 
9 16,216.0 0.02 6,262,656 7 0 0 
10 26,479.0 0.05 15,492,484 3 0 0 
28 20,994.0 0.02 7,631,770 8 0 0 
52 45,512.0 0.04 19,234,878 4 0 0 


首先 需要 观察 Pct Waits 的 比例 。 如 果 Pct Waits 的 数量 超过 1%, 则 说 明 undo 段 的 数量 过 少 。 
然后 要 观察 一 下 Wraps、Shrinks、Extents 的 数量 是 否 正常 。 如 果 这 些 值 过 高 ， 就 要 分 析 undo 是 
否 存在 问题 ,或 者 说 是 否 有 某 个 bug 导致 undo 性 能 存在 问题 ,通过 下 面 的 数据 可 以 看 出 每 个 undo 
段 的 大 小 : 


Rollback Segment Storage for DB: BOSSDB Instance: 
->Optimal Size should be larger than Avg Active 


bossl Snaps: 28819 -28820 











RBS No Segment Size Avg Active Optimal Size Maximum Size 
0 385,024 64,543 385,024 
T 8,511,488 2,862,784 444,719,104 
2 36,823,040 41,857,688 612,491,264 
3 33,677,312 17,271,927 2,147,606,528 
4 41,017,344 3,312,216 2,165,948,416 
5 42,065,920 9,242,569 1,610,735,616 
6 37,871,616 8,214,914 2,152,849,408 
7 276,946,944 225, 785,851 1,677,844,480 
8 251,781,120 214,080,651 2,214,715,392 
9 30,531,584 2,285,847 1,946,279,936 

10 35,774,464 75,155,736 1,208,082,432 
28 34,725,888 1,209,811 2,290,212,864 
52 45,211,648 4,962,510 2,483,150,848 


如 果 undo 段 的 大 小 不 均匀 ， 存 在 较 大 的 段 ， 那 么 说 明 系 统 中 的 事务 大 小 不 一 致 ， 存 在 一 些 大 型 


的 事务 。 





Undo Segment Summary 对 于 分 析 undo 的 情况 十 分 重要 ， 比 如 下 面 的 数据 : 





Undo Segment Summary for DB: BOSSDB boss1 28819 -28820 


-> Undo segment block stats: 


Instance: Snaps: 


-> uS - unexpired Stolen, uR - unexpired Released, uU - unexpired reUsed 
-> eS - expired Stolen, eR - expired Released, eU - expired reUsed 
Undo Undo Num Max Qry Max Tx Snapshot Out of uS/uR/uU/ 
TS Blocks Trans Len (s) Concurcy Too Old Space eS/eR/eU 
271,537 dHHBHEEBREBE 2,845 32 1 0 0/0/0/0/0/0 


Q Undo TS#; undo 表 空间 号 。 

Q Undo Blocks; undo 块 的 数量 。 

O Num Trans: 事务 的 数量 。 

O Max Qry Len (s) : undo 表 空间 里 最 大 查询 的 长 度 , 这 个 值 是 确定 undo retention 的 重要 参考 。 
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O Max Tx Concurcy: 最 大 的 事务 并 发 量 。 
Q Snapshot Too Old; Snapshot Too Old 出 现 的 次 数 。 
B Out of Space; 出 现 了 undo 表 空 间 不 足 的 次 数 。 
D us: unexpired Stolen, 未 预期 的 偷窃 。Stolen EM JE fth Dol iz: Be rp ATE FS JERTE , unexpired 


Stolen 是 偷 取 一 个 还 未 达到 释放 条 件 的 扩展 。 只 有 当 undo 表 空 间 不 足 时 可 能 出 现 这 种 情 
况 。 

Q uR; unexpired Released， 未 预期 的 释放 。 

Q uU; unexpired reUsed， 未 预期 的 重用 。 

如 果 存 在 上 述 3 种 未 预期 的 情况 ， 可 能 说 明 undo 表 空 间 不 足 。 下 面 的 信息 是 以 10 分 钟 为 单 





Undo Segment Stats for DB: BOSSDB Instance: bossl Snaps: 28819 -28820 
-» ordered by Time desc 


Undo Num Max Qry Max Tx Snap Out of uS/uR/uU/ 
End Time Blocks Trans Len (s) Concy Too Old Space eS/eR/eU 
29-Jul 15:30 80,389 #HHHHHTH 1,216 26 0 0 0/0/0/0/0/0 
29-Jul 15:20 133,397 ##HHHHHEH 2,845 14 1 0 0/0/0/0/0/0 
29-Jul 15:10 57,751 THERE GS 2,367 32 0 0 0/0/0/0/0/0 


E 之 优化 小 技巧 ) STATSPACK 报告 分 析 之 锁 分 析 


v 


STATSPACK 报告 中 的 锁 分 析 较 为 简单 ， 其 中 列 出 了 所 有 锁 等 待 的 情况 


Enqueue activity for DB: BSS97 Instance: BSS97  Snaps: 40115 -40116 
-» Enqueue stats gathered prior to 9i should not be compared with 9i data 
-» ordered by Wait Time desc, Waits desc 


Avg Wt Wait 

Eq Requests Succ Gets Failed Gets Waits Time (ms) Time (s) 

TX 373,140 373,136 5 5,200 110.03 572 
WL 5 3 2 4 93,883.50 376 
HW 2,428 2,084 344 1,356 11.25 105 
US 30,128 30,128 0 21,440 1.74 37 
TT 12,475 12,475 0 9,421 3.86 36 
SQ 15,203 15,203 0 1,200 28.00 34 
FB 2,088 2,088 0 1,027 2.62 3 
CF 4,927 4,924 3 380 5.42 2 
PS 3,428 2,092 1,336 356 3.44 1 
TA 82 82 0 82 2.80 0 
TS 32 32 0 16 2.75 0 
MD IT IX 0 11 2.45 0 
JQ 19 4 15 5 2.20 0 
TM 655,079 654,984 0 2 3.50 0 
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其 中 平均 等 待 时 间 和 总 等 待 时 间 都 是 需要 关注 的 。 如 果 enqueue 等 待 出 现在 Top 事件 中 时 就 更 加 


要 关注 这 一 证 了。 通过 下 面 的 脚本 ， 可 以 了 解 系统 中 锁 的 详细 情况 : 








set lines 200 

set pagesize 66 

spool locks.lis 

break on Kill on sid on username on terminal 

col Kill heading 'Kill String' format a13 

col res heading 'Resource Type' format 999 

col idl format 9999990 

col id2 format 9999990 

col locking heading 'Lock Held/Lock Requested' 
col lmode heading 'Lock Held' format a20 

col request heading 'Lock Requested' format a20 
col serials format 99999 

col username format a10 heading "Username" 
col terminal heading Term format a6 

col tab format a30 heading "Table Name" 

col owner format a9 

col LAddr heading "ID1 - ID2" 
col Lockt heading "Lock Type" 
col command format a25 
column sid format 990 

rem L.SID||','||S.SERIAL# Kill, 


umn 
umn 
umn 
umn 
umn 
umn 
umn 
umn 
umn 
umn 
umn 
umn 
format a18 
format a40 


umn 
umn 
umn 


lect 

nvl(S.USERNAME, 'Internal' ) 
L.SID, 
nvl(S.TERMINAL, 'None' ) 
decode (command, 





username, 


terminal, 


format a40 


0, 'None', decode (1.id2,0,U1.NAME||'.'||substr(T1.NAME,1,20),'None')) tab, 


decode (command, 
0, ' BACKGROUND ' , 
1,'Create Table', 
2,'INSERT', 
3,'SELECT', 
4,'CREATE CLUSTER', 
5, LTER CLUSTER', 
6,'UPDATE', 
7,'DELETE', 
8,'DROP', 
9,'CREATE INDEX', 
DROP INDEX', 
11,'ALTER INDEX', 
DROP TABLE', 
[35 mr. 
14,'---', 
15,'ALTER TABLE', 
165-22"; 
17,'GRANT', 
18,'REVOKE', 
19,'CREATE SYNONYM', 
20,'DROP SYNONYM' 
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21,'CREATE VIEW', 
22,'DROP VIEW', 


26,'LOCK TABLE', 
27,'NO OPERATION', 


28, 'RENAME', 
29, 'COMMENT', 
30, 'AUDIT', 


31, 'NOAUDIT', 

32, 'CREATE EXTERNAL DATABASE', 
33, 'DROP EXTERNAL DATABASE', 
34, 'CREATE DATABASE', 

35, 'ALTER DATABASE', 

36, 'CREATE ROLLBACK SEGMENT', 
37, 'ALTER ROLLBACK SEGMENT', 
38, 'DROP ROLLBACK SEGMENT', 
39, 'CREATE TABLESPACE', 

40, 'ALTER TABLESPACE', 

1,'DROP TABLESPACE', 
2,'ALTER SESSION', 
3,'ALTER USER', 
4,'COMMIT', 
5 
6 
7 
8 




















,'ROLLBACK', 

r "SAVEPOINT", 

,'PL/SQL EXECUTE', 
,'SET TRANSACTION', 
49,'ALTER SYSTEM SWITCH LOG', 
50,'EXPLAIN', 

51,'CREATE USER', 
52,'CREATE ROLE', 
53,'DROP USER', 

54,'DROP ROLE', 

55,'SET ROLE', 

56,'CREATE SCHEMA', 
57,'CREATE CONTROL FILE', 
58,'ALTER TRACING', 
59,'CREATE TRIGGER', 
60,'ALTER TRIGGER', 
61,'DROP TRIGGER', 
62,'ANALYZE TABLE', 
63,'ANALYZE INDEX', 
64,'ANALYZE CLUSTER', 
65,'CREATE PROFILE', 
66,'DROP PROFILE', 
67,'ALTER PROFILE', 
68,'DROP PROCEDURE', 
70,'ALTER RESOURCE COST', 
71,'CREATE SNAPSHOT LOG', 
72,'ALTER SNAPSHOT LOG', 
73,'DROP SNAPSHOT LOG', 
74,'CREATE SNAPSHOT', 
75，'ALTER SNAPSHOT', 
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76,'DROP SNAPSHOT', 
84,'-', 

85,'TRUNCATE TABLE', 
86,'TRUNCATE CLUSTER', 
87, test; 

88,'ALTER VIEW', 

BO ES. 

90: "ot, 
91,'CREATE FUNCTION', 
92,'ALTER FUNCTION', 
93,'DROP FUNCTION', 
R. 








94,'CREATE PACKAGE', 
95,'ALTER PACKAGE', 
96,'DROP PACKAGE', 
97,'CREATE PACKAGE BODY', 





98,'ALTER PACKAGE BODY', 
99,'DROP PACKAGE BODY', 
command||' - ???') COMMAND, 
decode(L.LMODE,1,'No Lock', 

2,'Row Share', 

3,'Row Exclusive', 

4,'Share', 

5,'Share Row Exclusive’, 

6,'Exclusive','NONE') lmode, 

decode(L.REQUEST,1,'No Lock', 

2,'Row Share', 

3,'Row Exclusive', 

4,'Share', 

5,'Share Row Exclusive', 

6, 'Exclusive','NONE') request, 
l.idi||'-'||1.id2 Laddr, 
l.type|]|' = '|| 
decode (1.type, 
'BL','Buffer hash table instance lock', 
'CF','Cross-instance function invocation instance lock', 
'CI','Control file schema global enqueue lock', 
'CS','Control file schema global enqueue lock', 
'DF','Data file instance lock', 
'DM','Mount/startup db primary/secondary instance lock', 
'DR','Distributed recovery process lock', 
'DX','Distributed transaction entry lock', 
'FI','SGA open-file information lock', 
'FS','File set lock', 
'IR','Instance recovery serialization global enqueue lock', 
'IV','Library cache invalidation instance lock', 
'MB','Master buffer hash table instance lock', 
'MM','Mount definition gloabal enqueue lock', 
'MR','Media recovery lock', 
'RE','USE ROW ENQUEUE enforcement lock', 
'RT','Redo thread global enqueue lock', 
'RW','Row wait enqueue lock', 
'SC','System commit number instance lock', 
'SH','System commit number high water mark enqueue lock', 
'SN','Sequence number instance lock', 
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'SQ','Sequence number enqueue lock', 
'ST','Space transaction enqueue lock', 
'SV','Sequence number value lock', 
'TA','Generic enqueue lock', 
'TD', 'DDL enqueue lock', 
'TE', 'Extend-segment enqueue lock', 
'TM', 'DML enqueue lock', 
'TT', 'Temporary table enqueue lock', 
'TX', 'Transaction enqueue lock', 
'UL','User supplied lock', 
'UN','User name lock', 
'WL','Being-written redo log instance lock', 
'WS','Write-atomic-log-switch global enqueue lock', 
'TS',decode(l.id2,0,'Temporary segment enqueue lock (ID2=0)' 

'New block allocation enqueue lock (ID2-1)'), 
'LA','Library cache lock instance lock (A-namespace)', 
'LB','Library cache lock instance lock (B-namespace 








' 
, 


'LC','Library cache lock instance lock (C=namespace)', 
'LD','Library cache lock instance lock (D-namespace)', 
'LE','Library cache lock instance lock (E-namespace)', 
'LF','Library cache lock instance lock (F-namespace)', 


( ) 
( ) 
( ) 
( ) 
( ) 
'LG','Library cache lock instance lock (G=namespace) 
'LH','Library cache lock instance lock (H-namespace) 
'LI','Library cache lock instance lock (I-namespace)', 
( ) 
( ) 
( ) 
( ) 
( ) 
( ) 
( ) 


'LJ','Library cache lock instance lock (J=namespace 
'LK', 'Library cache lock instance lock (K=namespace 
'LL','Library cache lock instance lock (L=namespace 
'LM', 'Library cache lock instance lock (M=namespace 
'LN', 'Library cache lock instance lock (N=namespace 
'LO','Library cache lock instance lock (O=namespace 
'LP', 'Library cache lock instance lock (P=namespace 
'LS','Log start/log switch enqueue loc 
'PA','Library cache pin instance lock 
'PB','Library cache pin instance lock 








~ namespace 
B=namespace 


'PC','Library cache pin instance lock (C=namespace)', 
'PD','Library cache pin instance lock (D-namespace)', 
'PE','Library cache pin instance lock (E-namespace)', 
'PF', 'Library cache pin instance lock (F-namespace)', 


k 
( 
( 
( 
( 
( 
( 
'PG','Library cache pin instance lock ( 
'PH','Library cache pin instance lock (H-namespace 
'PI','Library cache pin instance lock (I-namespace 
'PJ','Library cache pin instance lock (J-namespace 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 
( 


) 
) 
) 
) 
) 
) 
G-namespace) 
) 
) 
) 
'PL','Library cache pin instance lock (K-namespace)', 
) 
) 
) 
) 
) 
) 
) 
) 
) 
) 
) 


'PK', 'Library cache pin instance lock ! 
'PM','Library cache pin instance lock 
'PN', 'Library cache pin instance lock 
'PO','Library cache pin instance lock 
'PP','Library cache pin instance lock 
'PQ','Library cache pin instance lock 
'PR','Library cache pin instance lock 
'PS','Library cache pin instance lock 
'PT','Library cache pin instance lock 
'PU','Library cache pin instance lock 
'PV','Library cache pin instance lock 


L-namespace 
M-namespace 
N-namespace 
O-namespace 
P-namespace 
Q-namespace 
R-namespace 
S-namespace 
T-namespace 
U-namespace 
V-namespace 
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'RO', 
1222? 


from 


where 
and 
and 
and 
order 
/ 


"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
"Row 
'Row 
'Row 
'Row 
'Row 
'Row 
'Row 
'Row 
'Row 
'Row 
'Row 
'DDL 





'Library c 
Library c 
Library c 
Library c 


cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 
cache 


ache pin 
ache pin 
ache pin 
ache pin 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 
instance 


instance lock 
instance lock 
instance lock 
instance lock 


Lock 
Lock 
Lock 
Lock 
Lock 
Lock 
Lock 
Lock 
Lock 
Lock 
Lock 
Lock 


LOCK 





Lock 
Lock 
Lock 
Lock 
Lock 
Lock 
Lock 
Lock 





Lock 


( 


A=cache 


C=cache 
D=cache 
E=cache 
F=cache 


J=cache 
K=cache 
L=cache 





S=cache 
T=cache 
U=cache 
V=cache 
W-cache 
X-cache 


operations on temporary tbl', 


Number', 
State', 

ikick *. 
Slaves', 


'Multiple object resue', 

') Lockt 
VSLOCK L, 
VSSESSION S, 
SYS.USERS U1, 
SYS.OBJ$ T1 
L.SID = S.SID 
T1 .OBJ# 
Ul .USER# = T1.OWNER# 


S. 


TYPE 


by 1,2,5 


- decode(L.ID2,0,L.ID1,1) 


!= 'BACKGROUND' 


'Direct Loader Index Creation', 
'Instance 
'Instance 
'Redo Log 
'Parallel 
'Process Startup', 
'Parallel Slave Synchronization', 
,'SMON', 


W-namespace 
X-namespace 
Y-namespace 
Z-namespace 


' 
D 


' 
, 


D 


D 


D 


D 


D 


D 


D 


1 


D 


D 


D 


D 


D 


D 


, 


次 


D 


1 


D 


D 


D 


D 


D 


, 


) 
) 
) 
) 


' 
, 


' 
, 


' 
, 


' 
, 


Z 
à 
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度假 村 在 山里 面 , KETTORE, MARERA. He EXEGETUDIHRUUDNUETEER. PE T 
已 经 起 来 了 ， 因 为 老 于 有 起 床 一 支 烟 的 习惯 。 我 睁 开眼 ， 一 看 表 ， 是 早上 6 点 多 。 北 方 的 天 亮 得 
真 早 ， 要 在 深圳 我 都 以 为 是 七 八 点 钟 了 呢 。 

7 月 份 的 沈阳 早上 气温 适中 ， 在 山里 面 还 是 有 一 点 清凉 的 感觉 。 湖 边 的 空气 很 清新 ， 沿 湖 的 
马路 上 已 经 有 三 三 两 两 的 人 在 湖 边 散步 了 。 出 门 走 了 一 段 路 ， 看 到 湖 边 不 少 人 在 钓鱼 ,用 的 都 是 
很 大 的 海 笔 。 看 到 有 个 须发 皆 白 的 老者 一 边 抽 着 烟 一 边 盯 着 面前 的 十 几 根 鱼 笔 ， 我 走 过 去 问 道 :; 
"Kk, Em 

KSB: UB. RUA SEE? 这 湖 里 的 鱼 大 的 有 几 十 斤 。 

“真有 这 么 大 的 鱼 ， 还 不 早 就 让 你 们 钓 完了 ? ”我 表示 不 信 。 

“小 伙 子 你 还 别 不 信 ， 前 年 我 们 这 里 有 个 钓鱼 的 被 鱼 拉 到 湖 中 淹 死 了 。 他 钓 到 一 条 大 鱼 不 售 
得 松手， 把 鱼 线 缠 到 胎 膊 上 了 ， 几 天 后 才 从 湖 里 浮上 来 ， 那 叫 惨 呐 !1” 看 老 委 子 的 意思 不 像 是 在 
开玩笑 。 

和 老爷 子 聊 了 会 天 ， 又 往 前 走 了 走 ， 发 现 沿 湖 零 零 散 散 分 布 着 不 少 度假 村 。 散 步 回 去 ， 老 于 
还 在 抽烟 ,我 说 老 于 别 抽 了 ， 呆 会 你 还 要 讲课 呢 ， 还 是 先 吃饭 吧 。 吃 完 饭 我 和 老 于 一 起 到 教室 准 
备 一 下 投影 和 扩 音 器 材 。 今天 上 午 除 了 北方 公司 领导 和 小 齐 做 个 开场 白 之 外 , 就 是 老 于 介绍 沈阳 
项 目的 总 体 情况 ， 蓝 本 就 是 我 们 编写 的 《系统 性 能 评估 手册 》 和 《系统 优化 方案 》。 讲 《系统 性 
能 评估 和 手册》 时 一 切 都 很 正常 ， 沈 阳 项 目的 优化 效果 是 让 任何 人 都 信服 的 。 

不 过 在 介绍 《系统 优化 方案 》 时 出 现 了 一 个 小 插曲 。 老 于 讲 到 修改 DB_FILES 参数 时 说 ， 如 
果 DB_FILES 参数 超出 了 控制 文件 的 MAXFILES 参数 ， 就 必须 重建 控制 文件 。 当 时 下 面 就 有 人 表 
示 异 议 , 说 DB_FILES 修改 时 不 需要 重建 控制 文件 。 那 个 小 伙 子 是 河北 公司 的 老 刘 ， 也 是 一 个 从 
事 维护 工作 四 五 年 的 老 DBA 了 。 老 于 和 他 探讨 了 儿 句 ， 看 他 态度 十 分 坚决 ， 也 有 点 拿 不 准 主 意 
了 ， 就 问 了 一 句 :“ 老 白 ， 你 觉得 呢 ?”” 

我 正 坐 在 最 后 一 排 ， 准 备 着 下 午 我 的 课程 。 虽 然 刚 才 也 在 听 老 刘 和 老 于 讨论 ,不 过 并 没有 深 
入 去 考虑 这 个 问题 。 突 然 被 可 了 一 句 ， 也 有 点 拿 不 定 主意 。 不 过 在 我 的 印象 里 ， 如 果 文 件数 超过 
MAXFILES， 是 需要 重建 控制 文件 的 。 因 为 控制 文件 被 格式 化 后 ， 文 件 槽 位 是 固定 的 。 于 是 我 回 
答 说 :“ 肯 定 要 重建 控制 文件 ， 否 则 没 地 方 放 文 件 信 息 。” 长 期 以 专家 的 身份 和 各 种 客户 打交道 ， 
养 成 了 我 这 种 不 容 置疑 的 说 话 风格 。 听 到 我 这 么 坚决 的 口气 ， 老 刘 也 就 没有 再 坚持 了 。 
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中 午 吃饭 时 ， 老 刘 又 找到 我 ,希望 我 再 确认 一 下 ， 因 为 他 还 是 认为 自己 的 观点 是 对 的 。 吃 完 
饭 回 到 房间 ， 我 马上 上 Metalink 查 了 一 下 ， 发 现 我 和 老 于 确实 错 了 。 在 文档 101020.1 里 明确 介 
绍 了 ， 从 Oracle 8.0 开始， 控制 文件 就 可 以 自动 增长 了 ， 因 此 加 大 DB_FILES 参数 后 ， 如 果实 际 
创建 数据 文件 的 个 数 超过 了 MAXFILES 参数 的 限制 ， 控 制 文件 中 的 MAXFILES 参数 会 自动 增加 ， 
并 且 控 制 文件 也 会 自动 增长 。 这 些 年 磁 到 类 似 的 问题 ， 我 都 会 重建 控制 文件 ， 从 来 没有 怀疑 过 ， 
看 样子 这 个 错误 观点 已 经 害 了 不 少 人 了 。 我 马上 把 正在 午睡 的 老 于 叫 了 起 来 ， 说 :“ 今 天 我 们 两 
个 确实 错 了 ， 从 Oracle 8.0 开始 控制 文件 可 以 自动 增长 了 。 你 看 怎么 办 ? T 

“ 那 还 能 怎么 办 ， 下 午 主动 认错 吧 。” 老 于 飞快 地 看 了 一 饥 那 个 文档 。 说 完 这 名 话 ， 老 于 掏 出 
香烟 ， 一 声 不 咏 地 抽 了 起 来 。 

“下 午 我 的 课 , 我 来 承认 这 个 错误 吧 。 你 下 午休 息 一 下 ,不 一 定 非 要 去 教室 了 。” 我 觉得 老 于 
下 午 没 课 ， 专 门 为 这 件 事 去 解释 不 太 好 。 

下 午 一 上 课 ， 我 就 把 上 午 的 错误 向 大 家 解释 了 一 香 ， 并 且 对 上 午 提出 疑问 的 老 刘 表示 感谢 。 
为 了 鼓励 大 家 质疑 和 交流 ， 我 宣布 赠送 10 个 积分 给 老 刘 ， 以 表彰 他 发 现 我 们 的 问题 。 整 个 课堂 
里 的 气氛 一 下 子 热烈 了 起 来 ， 大 家 纷纷 表态 要 多 挑 我 的 毛病 ， 好 获得 积分 。 为 了 活跃 课堂 气氛 ， 
我 们 几 个 上 课 的 人 姿 钱 买 了 几 个 很 不 错 的 小 礼品 ， 并 且 在 上 午 老 于 开课 时 就 展示 了 这 些小 礼品 ， 
并 宣布 课程 结束 后 ， 积 分 前 三 名 的 人 会 拿 到 这 些小 礼品 。 

晚上 吃 完 晚 饭 ， 大 家 就 自由 活动 了 。 由 于 我 们 住 的 度假 村 十 分 偏 储 , 没有 汽车 基本 上 没 法 出 
门 ， 所 以 活动 也 只 能 在 度假 村 里 进行 。 好 在 度假 村 里 的 设施 十 分 齐备 ， 网 球 、 保 龄 球 、 改 毛 球 、 
乒乓 球 、 游 泳 、 健 身 、 桑 拿 、 按 摩 、KTV、 酒 吧 、 烧 烤 一 应 俱全 。 组 委 会 还 给 每 个 人 发 了 100 P: 
钱 的 代金 券 , 用 于 娱乐 消费 。 我 和 老 于 两 个 人 没 别 的 爱好 , 洗 了 个 澡 就 忠 到 房 顶 的 烧烤 吧 喝 酒 了 。 
今天 上 课 出 了 一 个 丝 漏 ， 所 以 今天 喝酒 的 话题 总 是 免不了 提 到 这 个 问题 。 现 在 知识 更 新 这 么 快 ， 
mH. Oracle 技术 那么 繁杂 ， 有 个 知识 点 没有 更 新 也 是 难免 的 , 我 劝 老 于 也 别 太 当 回 事 , 不 过 话 虽 
这 么 说 ， 我 自己 也 没 办 法 释然 。 

老 于 又 谈 到 了 我 们 一 个 多 月 前 谈 到 过 的 那个 话题 ， 是 不 是 我 们 这 批 DBA CHET, MAC 
经 跟 不 上 了 。 不 过 感慨 归 感 慨 ，DBA 是 一 个 职业 ， 而 不 是 某 种 知识 ， 跟 不 上 又 能 怎么 样 呢 ? 到 
了 我 们 这 个 年 龄 ， 学 习 新 知识 的 能 力 上 表 定 没 办 法 和 年 轻 人 相 比 。 不 过 我 们 现在 的 工作 基本 上 是 赁 
经 验 在 做 ， 而 不 是 赁 知识 了 ， 这 是 我 们 的 优势 。 谈 到 这 些 ， 大 家 的 心情 又 好 了 不 少 。 

沈阳 的 烤 鸡 架 确实 不 错 ， 我 们 两 个 人 每 个 人 拿 着 一 个 烤 鸡 架 ， 要 了 一 打 啤 酒 、 几 盘 考 毛豆 ， 
喝 得 挺 爽 快 。 棋 盘山 的 晚上 比 城 里 凉快 得 多 ， 丝 丝 山 风 让 人 感到 挺 民 意 的 , 坐 在 楼 顶 平台 上 喝酒 
简直 就 是 一 种 享受 。 我 们 喝 了 一 会 ,， 张 工 他 们 做 完 足 底 ， 也 发 现 了 这 么 个 好 地 方 ， 一 起 拥 过 来 喝 
酒 了 。 于 是 马上 叫 服 务 员 搬 了 两 箱 啤酒 过 来 ， 要 了 一 些 烤 串 ， 大 家 推 杯 换 芒 地 喝 了 起 来 。 明 天 还 
要 继续 上 课 ， 所 以 大 家 喝 得 都 不 多 ,不 过 一 大 群 人 吃 着 烤 串 喝 着 酒 ， 聊 聊 风花雪月 的 事情 ,心情 
也 好 了 不 少 。 

大 家 喝 到 1 : 00 左右 才 散 了 。 明 天 上 午 是 老 于 的 Oracle 数据 库 管理 课程 , 下 午 是 我 的 性 能 调 
优 实战 。 老 于 回 到 酒店 ， 打 开 电 脑 过 了 一 遍 明 天 的 讲义 ， 又 抽 了 一 支 烟 ， 才 躺 下 。 我 觉得 ， 今 天 
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的 事情 在 老 于 心里 留 下 的 阴影 还 是 没有 完全 化 解 。 说 实在 的 , 这 件 事 我 昨天 晚上 睡觉 前 也 想 了 很 
入 ,做 服务 的 人 , 积累 下 一 些 好 名 声 并 不 容易 ， 而 让 别人 对 你 产生 信任 是 十 分 关键 的 ， 举手投足 
都 必须 十 分 严谨 ， 如果 有 人 发 现 你 在 名 悠 他 ,那么 下 回 要 让 他 相信 你 的 话 就 难 了 。 有 了 上 午 的 事 
fH. 下午 我 讲课 时 ， 感觉 互动 的 情况 多 了 起 来 ,质疑 的 声音 也 多 了 起 来 。 这 对 于 今后 我 们 去 他 们 
那 边 实施 优化 项 目 十 分 不 利 , 有 什么 办 法 能 够 震慑 他 们 一 下 呢 ? SET. 也 别 多 想 了 , 明天 再 说 吧 。 


E für) 平均 事务 响应 时 间 的 计算 


书 中 经 常会 提 到 平均 事务 响应 时 间 , 实际 上 在 优化 项 目 中 , 平均 事务 响应 时 间 是 最 为 重要 的 
指标 之 一 , 那么 我 们 如 何 来 计算 平均 事务 响应 时 间 呢 ? 首先 我 们 要 理解 , 从 Oracle 数据 库 层 面 上 
计算 的 平均 事务 响应 时 间 和 客户 应 用 系统 的 平均 事务 响应 时 间 并 不 是 一 回 事 。 从 Oracle 数据 库 层 
面 上 的 平均 事务 响应 时 间 是 通过 在 一 段 时 间 内 提交 和 回 滚 的 数量 为 计数 统计 的 总 事务 量 。 将 一 段 
时 间 内 的 总 事务 量 除 以 时 间 就 得 出 了 平均 事务 数量 , 而 平均 事务 响应 时 间 就 是 基于 平均 事务 数量 
的 。 而 应 用 系统 的 事务 概念 可 能 和 Oracle 层面 的 事务 完全 无 关 。 虽 然 Oracle 层面 的 平均 事务 响 
应 时 间 和 应 用 层面 的 有 较 大 的 差别 , 但 是 平均 事务 响应 时 间 这 个 指标 值 仍然 在 优化 项 目 中 具有 很 
重要 的 参考 意义 。 

那么 平均 事务 响应 时 间 该 如 何 计算 呢 ? 通过 STATSPACK 报告 或 者 AWR 报告 ， 可 以 很 方便 
地 计算 出 平均 事务 响应 时 间 。 首 先 ， 我 们 从 STATSPACK 报告 中 找到 Top Events (顶级 事件 ): 


Top 5 Timed Events 





























———— % Total 
Event Waits Time (s) Ela Time 
db file scattered read 1,572,376 23,056 34.83 
db file sequential read 1,719,609 18,768 28.35 
buffer busy waits 621,320 10,200 15.41 
CPU time 8,487 12.82 
PX Deq: Execute Reply 243,188 2,183 3:30 


随便 找 一 个 等 待 事件 ， 比 如 db file scattered read ， 这 个 事件 占 整个 系统 的 34.85%。 然 后 看 下 





面 的 等 待 事件 明细 情况 : 
Avg 
Total Wait wait Waits 
Event Waits Timeouts Time (s) (ms) /txn 
db file scattered read 1,572,376 0 23,056 15 TEX 
db file scattered read 这 个 事件 ， 每 个 事务 等 待 71.7 次 ， 每 次 等 待 15ms， 那 么 每 个 事务 等 待 这 个 
事件 的 时 间 是 71.7 x 15-1 075.3ms， 而 这 个 等 待 事件 占 整 个 系统 等 待 时 间 的 34.85%， 因 此 平均 事务 





响应 时 间 是 : 1075.5/0.3485-3 085ms。 值 得 注意 的 是 ， 由 于 在 STATSPACK 报告 中 ， 每 次 等 待 时 间 、 


平均 事务 等 待 次 数 等 数值 的 取 值 是 通过 取 整 的 ， 
误差 。 更 为 精确 的 计算 方法 应 该 是 平均 事务 响应 























因此 可 能 通过 不 同 的 等 待 事件 计算 出 来 的 值 会 有 些 





时 间 为 23 056000/1 572 376 x 71.7/0.3485=3 016ms, 


7 月 21 日 课堂 风波 317 





& 2 优化 小 技 巧 ) STATSPACK 报告 分 析 之 门 锁 分 析 


STATSPACK 报告 是 分 析 门 锁 最 好 的 工具 之 一 。STATSPACK 报告 中 包含 了 大 量 门 锁 的 数据 ， 
这 些 数据 可 以 初步 定位 系统 级 的 门 锁 问题 。 要 分 析 门 锁 ， 首 先 要 从 Load Profile 看 起 : 


Instance Efficiency Percentages 


(Target 100%) 


Buffer Nowait 
Buffer Hit 
Library Hit 
Execute to Parse 
Parse CPU to Parse Elapsd 


这 里 的 Latch Hit 是 在 本 报告 期 间 总 体 的 门 锁 全 命中 率 ， 这 个 
般 来 说 门 锁 的 问题 


值 比较 低 〈 低 于 99% 一 


99.93 Redo NoWait $: 100.00 
95.47 In-memory Sort $: 99:99 
99.24 Soft Parse $: 97.68 
29.98 Latch Hit *: 99.75 
2.12 $ Non-Parse CPU: 96.75 


外 标 越 接近 100% 越 好 。 如 果 这 个 
页 就 相当 严重 了 ) ， 那 么 在 分 析 这 份 报 告 时 ， 就 要 十 分 关 


注 门 锁 的 问题 了 。 虽 然 从 命中 率 上 我 们 看 不 出 很 明显 的 问题 ， 不 过 在 Top 事件 里 : 


Top 5 Timed Events 





latch free 

db file sequential read 
CPU time 

db file scattered read 
library cache pin 


可 以 看 出 latch free 占 整 


Latch Activity for DB: HCSP 


->"Get Requests", 


-»"NoWait Requests", 


Consistent RBA 

FAL request queue 

FIB s.o chain latch 

FOB s.o list latch 

SOL memory manager latch 
SQL memory manager worka 
XSKSFQP 

active checkpoint queue 
alert log latch 

archive control 

archive process latch 


$ Total 
Waits Time (s) Ela Time 
1,098,363 606,375 76.58 
11,615,630 73,616 9.30 
55,262 6.98 
2,377,376 26,913 3.40 
3,865 10,408 1.33 
个 等 待 事件 的 76.58%。 下 面 有 关于 门 锁 的 更 为 明细 的 信息 : 
Instance: hcsp Snaps: 111 -121 
"Pct Get Miss" and "Avg Slps/Miss" are statistics for 
willing-to-wait latch get requests 
"Pct NoWait Miss" are for no-wait latch get requests 
->"Pct Misses" for both should be very close to 0.0 
Pct Avg Wait Pct 
Get Get Slps Time NoWait NoWait 
Requests Miss /Miss (s) Requests Miss 
295,240 0.0 0 0 
10 05:0 0 0 
194 0.0 0 0 
99,524 0.0 0.5 1 0 
al 0.0 0 2,431 0.0 
500,795 0.0 0.6 21 0 
49 Q's0 0 0 
25,960 0.0 0 0 
23 0.50 0 0 
300 0.0 0 0 
171 0.0 0 0 
2,868,069 0.1 073 125 0 


cache buffer handles 
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cache buffers chains 1,528,766,244 0.1 0.4 #HHHHH 65,503,162 23.5 
cache buffers lru chain 1,667,682 0.6 0.2 782 69,088,014 3.8 
cas latch 52,531,336 0.1 0.3 3824 0 
channel handle pool latc 6,653 0.0 0 0 
channel operations paren 15,341 0.0 0 0 
checkpoint queue latch 5,245,583 0.0 0.2 7 817,925 0.0 
child cursor hash table 1,617,769 0.1 0.3 86 0 
direct msg latch 1,411,172 0.0 0.0 0 0 
dml lock allocation 1,714,958 0.2 0.5 304 0 
done queue latch 334,052 0.1 0.1 0 350,600 0.1 
dummy allocation 6,911 0.0 0 0 
enqueue hash chains 4,946,060 0.1 0.5 752 0 
enqueues 4,910,923 0.2 0.5 815 0 
event group latch 3,325 0.0 0 0 
global tx hash mapping 649,208 0.0 0.6 0 0 
hash table column usage 1,169 0.3 0.5 5 32,482,472 5.0 


在 这 个 部 分 ， 我 们 重点 观察 Pct Get Miss 和 Pct NoWait Miss 超过 1% 的 门 锁 。 比 如 在 上 面 的 
数据 中 ,cache buffers chains 和 cache buffers Iru chain 的 门 锁 均 存在 问题 ,特别 是 cache buffers chains 
的 Pct NoWait Miss 达到 23.5%。 下 面 我 们 进一步 查看 这 两 个 门 锁 的 情况 : 


Latch Sleep breakdown for DB: HCSP Instance: hcsp Snaps: 111 -121 
-> ordered by misses desc 








Get Spin & 

Latch Name Requests Misses Sleeps Sleeps 1->4 

cache buffers chains 1,528,766,244 1,415,629 535,842 888231/518990/ 
8373/35/0 

row cache objects 84,271,679 1,375,515 70,469 1307405/65853/ 
2170/87/0 

row cache enqueue latch 80,394,155 866,473 10,018 856602/9724/ 
147/0/0 

library cache 55,951,057 759,496 278,624 489396/261812/ 
8068/220/0 

shared pool 19,702,554 249,585 43,609 207232/41159/ 
1148/46/0 

cas latch 52,531,336 78,072 25,050 53208/24678/ 
186/0/0 

library cache pin 29,345,261 61,538 21,471 40280/21045/ 
213/0/0 

simulator lru latch 3,296,405 50,373 47,912 2854/47127/3 
91/1/0 

library cache pin allocati 21,024,601 36,617 18,078 18655/17847/ 
114/1/0 

simulator hash latch 55,564,795 34,275 6,502 27824/6401/49/ 
1/0 

session allocation 7,403,893 30,725 14,038 16760/13892/ 
73/0/0 

session idle bit 54,312,472 21,733 5,213 16539/5175/19/ 
0/0 

multiblock read objects 7,538,869 19,500 6,013 13544/5899/ 





57/0/0 
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cache buffers lru chain 1,667,682 10,703 2,660 8091/2564/ 
48/0/0 

enqueues 4,910,923 10,523 5,096 5449/5052/22 
/0/0 


上 述 数据 是 按照 Misses 的 数量 排序 的 。 从 这 里 可 以 看 出 cache buffers chains 的 Sleeps 次 数 还 
是 排 在 第 一 位 , 说 明 这 个 门 锁 存 在 的 问题 最 多 。 在 一 个 小 时 内 ,Spin 的 次 数 居然 高 达 888 231 次 ， 
Sleep 1 的 次 数 达 到 518 990 次 ，Sleep 2 的 次 数 为 8 373， 甚 至 出 现 了 35 次 的 Sleep 三 的 情况 。 根 
据 上 面 的 情况 来 看 ， 我 们 重点 需要 分 析 cache buffers chains 的 等 待 : 

Latch Miss Sources for DB: HCSP Instance: hcsp Snaps: 111 -121 


-> only latches with sleeps are shown 
-> ordered by name, sleeps desc 


NoWait Waiter 
Latch Name Where Misses Sleeps Sleeps 
FOB s.o list latch ksfd allfob 0 6 6 
FOB s.o list latch ksfdfol02 0 1 1 
SQL memory manager worka qesmmIRegisterWorkArea 0 5 2 
SQL memory manager worka qesmmIUnRegisterWorkArea 0 2 1 
cache buffer handles kcbzfs 0 253 257 
cache buffer handles kcbzgs 0 246 242 
cache buffers chains kcbgtcr: kslbegin excl 0 227,599 414,454 
cache buffers chains kcbrls: kslbegin 0 199,620 20,593 
cache buffers chains kcbgtcr: fast path 0 73,320 77,189 
cache buffers chains kcbzib: multi-block read: 0 7,494 0 
cache buffers chains kcbzgb: scan from tail. no 0 5,609 0 
cache buffers chains kcbzwb 0 5,367 10,080 
cache buffers chains kcbchg: kslbegin: bufs not 0 4,870 2,647 
cache buffers chains kcbzib: finish free bufs 0 3,206 4,863 
cache buffers chains kcbchg: kslbegin: call CR 0 2,407 1,455 
cache buffers chains kcbgtcr: kslbegin shared 0 1,553 1,204 
cache buffers chains kcbgcur: kslbegin 0 884 910 
cache buffers chains kcbget: pin buffer 0 741 1,344 
cache buffers chains kcbgtcr 0 702 1 
cache buffers chains kcbcge 0 684 59 
cache buffers chains kcbget: exchange rls 0 667 2 
cache buffers chains kcbbic2 0 267 24 
cache buffers chains kcbbxsv 0 235 483 
cache buffers chains kcbnlc 0 179 217 
cache buffers chains kcbget: exchange 0 158 12 
cache buffers chains kcbzib: exchange rls 0 76 2 
cache buffers chains kcbbicl 0 70 146 
cache buffers chains kcbnew_1 0 43 2 
cache buffers chains kcbnew 0 28 69 
cache buffers chains kcbibr 0 27 43 
cache buffers chains kcbclc 0 7 9 
cache buffers chains kcbesc: escalate 0 2 0 
cache buffers chains kcbkzs 0 2 10 
cache buffers chains kcbsol: set no access 0 2 0 
cache buffers chains kcbbwdb 0 1 1 
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从 上 面 等 待 源 的 分 析 可 以 看 出 这 个 门 锁 等 待产 生 的 位 置 (在 代码 中 的 位 置 )。Oracle 内 部 的 
开发 人 员 和 GCS 的 技术 人 员 可 以 很 容易 地 定位 等 待 的 原因 ,比如 排 在 第 一 位 的 是 kcbgter: kslbegin 
excl 这 是 在 做 一 致 性 读 产 生 的 。 这 部 分 分 析 比 较 专 业 , 一 般 的 DBA 很 难 分 析 , 不 过 可 以 由 Oracle 
内 部 专门 处 理 bug 的 技术 人 员 来 协助 分 析 。 
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7B228.* 世博 园 一 日 游 和 心 想 事 成 


昨天 还 算 比较 顺利 ， 晚 上 又 是 烤 鸡 架 和 喝酒 。 因 为 今天 没 课 了 ， 所 以 昨 晚 大 家 喝 得 比较 晚 ， 
还 喝 倒 了 儿 个 。 今 天 会 务 组 组 织 去 沈阳 世博 园 参观 。 我 没有 睡懒觉 的 习惯 ,虽然 昨天 夜里 2 : 00 
了 才 睡 ,今天 早上 7 : 00 时 还 是 自然 醒 了 。 老 于 昨天 喝 的 有 点 多 ， 今 天 早上 还 在 沉睡 。8 : 00 才 
有 早饭 吃 ， 所 以 决定 到 斋 边 散步 。 今 天 那个 老头 没 来 钓鱼 ， 不 禁 又 想起 了 他 说 的 调 里 有 大 鱼 的 事 
情 。 上 昨天 晚饭 时 上 了 一 条 特别 大 的 铃 鱼 ， 一 尺 多 的 大 盘子 居然 还 装 不 下 ， 厨 师 融 断 了 骨头 把 鱼 盘 
过 来 居然 尾巴 和 头 连 起 来 了 ， 看 样子 连 头 带 尾 有 接近 一 米 长 。 

吃 过 早饭 , 大 家 坐 了 中 巴 去 世博 园 。 实际 上 , 世博 园 就 在 棋盘 山 旁 边 , 是 以 前 的 植物 园 改 的 。 
之 前 , 我 其 实 已 经 去 过 了 , 说 实在 的 除了 大 并 没有 什么 我 很 感 兴趣 的 东西 ， 花 花草 草 的 在 北方 可 
能 算 个 稀奇 物 ， 在 深圳 是 出 门 就 看 得 到 的 。 我 订 了 今天 下 午 3 : 00 的 航班 回 深圳 。 本 来 不 想 跟着 
大 部 队 行动 了 ， 由 于 住 在 这 个 地 方 没 车 很 不 方便 ， 想 出 去 也 就 只 能 跟着 大 部 队 了 。 

车 刚 开 出 风景 区 大 门 ， 张 工 就 从 车 尾 走 了 过 来 ， 把 电话 交 给 我 说 :“ 小 孙 说 销 账 的 数据 库 挂 
住 了 ， 什 么 操作 都 做 不 了 ， 你 帮 着 看 看 。 

听 着 张 工 这 么 一 说 , 整 车 的 人 的 目光 都 条 向 了 我 。 人 要 是 运气 来 了 是 挡 也 挡 不 住 ， 本 来 我 一 
直 想 找 个 机 会 表现 一 下 ,为 前 天 的 粥 漏 弥 补 一 下 ,这 个 机 会 真 像 是 想 睡觉 时 就 有 人 递 个 枕头 过 来 ， 
想 什 么 有 什么 啊 。 从 目前 销 账 数据 库 来 看 ， 能 让 所 有 操作 都 挂 住 的 故障 ， 可 能 性 最 大 的 就 是 归档 
目录 满 了 。 前 几 天 也 听 说 过 磁带 库 最 近 总 是 有 点 问题 ， 我 还 建议 他 清洗 一 下 磁头 。 

为 了 让 大 家 增加 一 些 神秘 感 ,我 有 意 没 有 按照 正常 思路 去 处 理 这 个 问题 ,直接 让 小 孙 用 af -k 
查 一 下 文件 系统 的 情况 。 小 孙 马 上 查 了 一 下 ， 发 现 /archive 目录 满 了 。 了 听 到 这 个 消息 ， 我 就 知道 
这 回 赌 对 了 。 我 装模作样 地 让 小 孙 检 查 一 下 警告 日 志 ,， 果不其然 , 在 警告 日 志 里 出 现 了 归档 无 法 
完成 的 警告 信息 。 于 是 我 告诉 车 上 的 刘 工 ,让 他 安排 检查 一 下 备份 系统 的 情况 ， 同 时 让 小 孙 先 把 
归档 目录 下 的 部 分 归档 日 志 移 到 其 他 文件 系统 下 。 小 孙 那 边 的 mv 命令 一 发 出 ， 就 发 现 系 统 恢复 
正常 了 。 

我 连忙 把 电话 交 给 张 工 ， 说 :“ 故 障 排除 了 ， 剩 下 的 问题 要 麻烦 郭 工 检 查 一 下 备份 系统 是 不 
是 有 问题 。 

张 工 也 有 点 惊讶 :“ 这 就 搞定 了 ? 你 牛 啊 。 

我 说 :“ 那 当然 ， 没 这 两 手 还 敢 给 您 老人 家 干 活 啊 。” 
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的 眼光 都 有 很 大 的 变化 。 这 个 时 候 郭 工 也 打 完 了 电话 ， 说 确实 是 备份 出 问题 了 ， 昨 天 晚上 的 增 量 
备份 就 没有 成 功 。 他 已 经 安排 现场 值班 的 人 去 处 理 这 个 问题 了 ， 应 该 不 会 有 什么 大 事 。 

从 全 车 人 的 表情 可 以 看 出 , 我 的 目的 完全 达到 了 。 和 客户 打交道 ,建立 信任 关系 是 十 分 关键 
的 一 件 事情 。 我 经 常 和 公司 的 年 轻 人 说 ,做 服务 三 分 靠 技 术 ， 七 分 靠 沟 通 。 建 立信 任 关系 是 沟通 
中 十 分 重要 的 一 点 。 今 天 我 没有 按照 常规 的 方式 ,让 小 孙 从 警告 日 志和 操作 系统 开始 检查 ,就 直 
奔 主题 ,目的 就 是 要 让 车 里 的 人 感受 到 ， 我们 确实 是 专家 ,我 们 是 值得 信赖 的 。 其 实 我 也 留 有 后 
手 ， 如 果 目 录 没 满 ， 我 会 立即 让 小 孙 检 查 警 告 日 志 、 操 作 系 统 、1/O 等 情况 。 如 果 我 没有 赌 对 ， 
其 实 也 没什么 影响 ,这 种 问题 对 于 我 来 说 基本 上 没有 难度 。 这 本 来 就 是 给 我 一 次 作秀 的 机 会 ， 关 
键 是 怎么 表现 得 完美 ， 今 天 这 场 秀 做 得 完全 成 功 。 

在 游园 时 ， 前 天 对 控制 文件 重建 提出 异议 的 刘 工 和 我 说 ,他 们 的 系统 目前 的 问题 不 比 沈阳 少 ， 
这 回 北方 公司 安排 的 第 二 批 优化 项 目 里 就 有 他 们 省 ， 到 时 候 希 望 我 能 去 他 们 那里 做 实施 。 

我 把 刘 工 的 原 话 告诉 了 小 齐 ， 小 齐 听 了 之 后 忍 不 住 笑 了 :“ 今 天 你 玩 的 这 手 太 漂 亮 了 ， 河 北 
这 边 不 太 好 打交道 ,而且 系统 问题 也 很 多 , 我 们 也 一 直 担 心 他 们 那 边 的 项 目 不 好 干 ， 既 然 他 们 有 
这 个 态度 ， 倒 是 个 好 事情 。 

中 午 和 他 们 一 起 在 世博 园 吃 了 点 快餐 , 我 就 和 大 家 分 手 了 。 他 们 游 完 世 博 园 还 准备 晚上 去 中 
街 刘老根 大 舞台 看 二 人 转 。 我 今天 就 可 以 回 家 了 ， 说 实在 的 ， 这 段 时 间 一 直 在 外 面 ， 每 次 回 家 时 
还 是 很 兴奋 的 。 

昕 说 我 要 先 走 , 郭 工 就 说 他 也 正好 要 回 市 里 去 处 理 磁带 库 的 事情 , 他 可 以 把 我 送 到 青年 大 街 
那 边 ， 省 得 我 还 要 走 老 远 去 打车 ， 于 是 我 就 坐 了 郭 工 的 车 子 回 市 里 。 在 路 上 ， 郭 工 同 我 今天 怎么 
能 这 么 快 定位 到 这 个 问题 ， 我 说 这 就 是 经 验 了 。 排 障 是 DBA 的 一 项 最 基本 的 技能 ， 大 多 数 情况 
下 ， 只 要 找到 问题 ， 解 决 问题 都 不 难 ， 每 个 DBA 只 要 愿意 下 工夫 去 找 ， 都 没有 问题 。 关 键 是 每 
个 人 发 现 问 题 所 需要 的 时 间 不 同 , 这 就 取决 于 经 验 和 技术 能 力 。 像 今天 的 事情 ， 从 系统 挂 住 到 解 
决 问 题 不 到 10 分 钟 的 时 间 ， 在 运 维 工 作 中 只 要 记录 一 个 事件 ， 而 不 用 算是 一 次 事故 。 如 果 换 一 
个 新 手 做 ,估计 半 个 小 时 也 不 一 定 搞 得 好 ， 而 超过 30 分 钟 就 必须 记录 一 次 事故 了 。 能 这 么 快 定 
位 问题 , 是 十 多 年 经 验 的 积累 , 也 只 有 对 Oracle 的 基本 原理 搞 得 很 清楚 了 , 并 且 对 所 维护 的 系统 
十 分 了 解 ， 才 能 够 第 一 时 间 去 排查 最 可 能 出 问题 的 部 分 。 最 近 这 两 个 月 ,我 整 天 面 对 这 几 套 系统 
做 分 析 ， 已 经 对 这 些 系统 的 情况 了 如 指 和 党 ， 所 以 才能 做 出 如 此 快速 的 处 理 。 面 对 一 套 新 的 系统 ， 
处 理 的 时 间 可 能 要 长 一 些 了 。 

郭 工 听 了 我 这 番 话 ,这 有 感触 ， 说 :“ 我 们 做 甲 方 的 ， 想 达到 这 个 境界 基本 上 没什么 希望 了 。 
杂事 太 多 ， 根 本 没有 时 间 认 真 研究 一 下 技术 ， 研 究 一 下 系统 。 确实 也 是 ， 我 曾经 和 好 多 甲 方 的 
TEMAT, 他们 以 前 都 是 Oracle 方面 的 高 手 ， 而 随 着 自己 在 企业 里 越 来 越 资深 ,从 事 的 管理 
工作 越 来 越 多 ， 时 间 长 了 ， 技 术 方 面 就 生 政 了 ， 其 至 很 多 人 只 能 停留 在 理论 和 概念 上 了 。DBA 
这 个 职业 ,大 多 数 情 况 下 只 有 在 第 一 线 工 作 的 人 才 有 动力 去 继续 学 习 , 一 旦 离开 生产 第 一 线 , 技 
术 退 化 就 只 是 时 间 的 问题 了 。 

今天 飞机 还 算 准 点 ， 刚 通过 安检 ,就 听 到 了 航班 登 机 的 预告 。 今 天 在 飞机 上 ， 躺 在 舒适 的 头 
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SEAS, PASS, Wak + OER. LAME, WAS 月 初 的 迷茫 到 6 月 初 的 无 奈 ， 最 后 到 今天 的 
皆大欢喜 真 像 一 出 戏 一 样 。 从 这 个 项 目 里 我 又 学 到 了 很 多 东西 ， 从 老 于 身上 我 体会 到 了 什么 叫 
责任 ,从 老 熊 身上 我 体会 到 了 什么 叫 执着 ,从 老 方 身上 我 体会 到 了 什么 叫 决断 ， 从 老 肖 身上 我 体 
会 到 了 什么 叫 坚 持 。 每 个 项 目 结束 后 ， 认 真 回顾 和 总 结 一 下 是 我 的 习惯 。 这 种 回顾 一 般 都 是 非 正 
式 的 ， 不 过 我 会 花 上 一 些 时 间 来 冥想 ， 每 次 冥想 都 会 给 我 带 来 收获 。 


SREI) STATSPACK 报告 分 析 之 Top HR 


STATSPACK 的 采样 可 以 分 为 几 种 级 别 。 默认 情况 下 , Snap 是 5 级 的 。 我们 也 可 以 通过 exec 
statspack.Snap (i_snap_level=>6) 来 获得 6 级 的 采样 。 使 用 6 级 或 者 6 级 以 上 的 采样 生成 的 
报告 中 有 一 个 十 分 有 用 的 章节 ， 就 是 Top 段 。 比 如 : 


Top 10 Logical Reads per Segment for DB: TBCS Instance: tbcsl Snaps: 37838 -37 











-» End Segment Logical Reads Threshold: 10000 
Subobject Obj. Logical 

Owner Tablespace Object Name Name Type Reads  $Total 
TBCS INX PK PRIVILEGE ORG INDEX 396,406,768 28.48 
TBCS DATA PARAMETER VALUE TABLE 260,254,096 18.70 
TBCS DATA ACCAGENTUNIT TABLE 24,922,480 1.79 
TBCS DATA DICT ITEM TABLE 17,116,976 1.23 
TBCS DATA PRODUCT PRIVILEGE TABLE 16,738,672 1420 
IBOSS DATA TRANSLOG TABLE 12,402,160 .89 
TBCS DATA TX LOGIN MSG TABLE 11,570,976 .83 
TBCS INX311 PK SSC 311 200505 INDEX 10,679,200 s 
TBCS IDX310 PK SSC 310 200505 INDEX 10,673,040 I 
TBCS IDX314 PK SUBSCRIBER CRIBER 314 INDEX 10,261,408 .74 





Top 10 Physical Reads per Segment for DB: TBCS Instance: tbcsl Snaps: 37838 -3 














-» End Segment Physical Reads Threshold: 1000 
Subobject Obj. Physical 

Owner Tablespace Object Name Name Type Reads %Total 
MISC DATA TRANSLOG LOG_200506 TABLE 159,619 2.59 
TBCS IDX310 PK SOCIAL ENTITY2 ENTITY 310 INDEX 151,215 2.46 
TBCS DATA310 SUBSCRIBER CRIBER 310 TABLE 147,184 2.39 
TBCS DATA312 SUBSCRIBER CRIBER 312 TABLE 142,406 2.31 
MISC DATA TRANSLOG LOG_200508 TABLE 116,599 1.89 
MISC DATA TRANSLOG LOG 200507 TABLE 115.775 1.88 
TBCS DATA315 SUBSCRIBER CRIBER 315 TABLE 114,218 1.86 
TBCS INX315 PK SOCIAL ENTITY2 ENTITY 315 INDEX 104,659 1.70 
TBCS INX312 PK SOCIAL ENTITY2 ENTITY 312 INDEX 100,699 1.64 
IBOSS DATA TRANSLOG TABLE 91,783 1.49 























Top 10 Buf. Busy Waits per Segment for DB: TBCS Instance: tbcs1 Snaps: 37838 - 
-» End Segment Buffer Busy Waits Threshold: 100 
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Buffer 
Subobject  Obj. Busy 
Owner Tablespace Object Name Name Type Waits Total 
MISC DATA TRANSLOG LOG 200508 TABLE 13,588 16.44 
MISC DATA TRANSLOG LOG_200507 TABLE 11,386 13.18 
TBCS IDX310 PK SOCIAL ENTITY2 ENTITY 310 INDEX 7,626 9.23 
MISC DATA TRANSLOG LOG 200506 TABLE 6,942 8.40 
TBCS DATA PK AGENTCHARGE CHECK ECK 200508 INDEX 5,962 74.21 
TBCS DATA AGENTCHARGE CHECK ECK 200508 TABLE 4,483 5.42 
TBCS INX312 PK SOCIAL ENTITY2 ENTITY 312 INDEX 3,691 4.47 
IBOSS INX PK_STATCHGNTFYREQ REQ_200508 INDEX 2,892 3250 
IBOSS INX INX_STATCHGNTFYREQ REQ_200508 INDEX 1,799 2.18 
TBCS INX315 PK SOCIAL ENTITY2 ENTITY 315 INDEX 1,615 1495 
Top 10 Row Lock Waits per Segment for DB: TBCS Instance: tbcsl Snaps: 37838 -3 
-» End Segment Row Lock Waits Threshold: 100 
Row 
Subobject  Obj. Lock 
Owner Tablespace Object Name Name Type Waits  $Total 
TBCS DATA312 PK CYCLEINV BILLITEM 312, 200508 INDEX 274 6.39 
TBCS DATA312 OPERATOR FORMNUM ORMNUM 312 TABLE 180 4.19 
IBOSS INX PK STATCHGNTFYREQ REQ 200508 INDEX 150 3.50 
TBCS DATA310 PK CYCLEINV BILLITEM 310, 200508 INDEX 145 3:,38 
TBCS DATA315 PK CYCLEINV BILLITEM 315 200508 INDEX 103 2.40 
TBCS DATA313 PK CYCLEINV  BILLITEM 313. 200508 INDEX 94 2.19 
MISC INX PK STATCHGNTFYREQ REQ 200508 INDEX 93 24517 
TBCS DATA312 PK SWC REDUNDANT 312 200508 INDEX 67 1.56 
TBCS DATA311 PK CYCLEINV BILLITEM 314 200508 INDEX 57 1433 
TBCS DATA312 IDX EXECTIME SWITCHC 312 200508 INDEX 53 1.24 
Top 10 ITL Waits per Segment for DB: TBCS Instance: tbcsl Snaps: 37838 -37882 
-» End Segment ITL Waits Threshold: 100 
Subobject  Obj. ITL 
Owner Tablespace Object Name Name Type Waits  $Total 
TBCS DATA315 PK CYCLEINV BILLITEM CLEINVOICE INDEX 12 10.43 
TBCS DATA312 PK CYCLEINV BILLITEM CLEINVOICE INDEX 8 6.96 
TBCS DATA315 IDX STATO CHARGE FIN STATO CHAR INDEX 7 6.09 
TBCS DATA315 PK SWC REDUNDANT SWITCH COM INDEX 5 4.35 
TBCS DATA312 PK FRAUD CONTROL ACC AUD CONTRO INDEX 4 3.48 
TBCS DATA311 PK CYCLEINV BILLITEM CLEINVOICE INDEX 4 3.48 
TBCS DATA312 IDX FRAUDLOG CTRLTIM FRAUD CONT INDEX 4 3.48 
IBOSS INX PK STATCHGNTFYREQ STATCHGNTF INDEX 3 2.61 
TBCS DATA310 PK SWC REDUNDANT SWITCH COM INDEX 3 2.61 
TBCS DATA313 PK RECEPTION RECEPTION INDEX 3 2.61 
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Top 10 CR Blocks Served (RAC) per Segment for DB: TBCS Instance: tbcsl  Snaps: 














-» End Global Cache CR Blocks Served Threshold: 1000 
CR 
Subobject Obj. Blocks 
Owner Tablespace Object Name Name Type Served  $Total 
TBCS INX312 INDEX SMJOBNOTIFY TR 312  LESSI INDEX 41,922 10.69 
TBCS IDX310 INDEX SMJOBNOTIFY TR 310 LESSI INDEX 39,374 10.04 
TBCS INX315 INDEX SMJOBNOTIFY TR 315 LESSI INDEX 36,965 9.43 
IBOSS DATA STATCHGNTFYREQ REQ_200508 TABLE 32,272 8.23 
TBCS DATA IDX_SMP_COMM_RESULTC OMM_200508 INDEX 27 556 7.03 
TBCS IDX314 INDEX SMJOBNOTIFY TR 314 LESSI INDEX 21,635 5452 
TBCS IDX313 INDEX SMJOBNOTIFY TR 313 LESSI INDEX 20,718 5.28 
TBCS DATA SMP_COMM OMM_200508 TABLE 155055 3.84 
IBOSS INX PK STATCHGNTFYREQ REQ 200508 INDEX 13,798 3.52 
TBCS DATA312 SMJOBNOTIFY 312 LESSI TABLE 7,882 2.01 








Top 10 CU Blocks Served (RAC) per Segment for DB: TBCS Instance: tbcsl Snaps: 











-» End Global Cache CU Blocks Served Threshold: 1000 
CU 
Subobject Obj. Blocks 
Owner Tablespace Object Name Name Type Served  $Total 
IBOSS DATA STATCHGNTFYREQ REQ_200508 TABLE 32,454 8.24 
IBOSS INX INX_STATCHGNTFYREQ REQ 200508 INDEX 23,108 5487 
IBOSS INX PK STATCHGNTFYREQ REQ 200508 INDEX 21,119 5.36 
MISC INX PK STATCHGNTFYREQ REQ 200508 INDEX 17,251 4.38 
PERFSTAT USERS STATSSSQL PLAN USAGE INDEX 9,932 2452 
TBCS DATA PRIVILEGE ORG TABLE 9,155 2.33 
TBCS INX312 INDEX SMJOBNOTIFY TR 312 LESSI INDEX 9,046 2.30 
TBCS IDX310 INDEX SMJOBNOTIFY TR 310, LESSI INDEX 8,963 2.28 
SYS SYSTEM SEQS TABLE 8,400 2513 
TBCS INX315 INDEX SMJOBNOTIFY TR 315 LESSI INDEX 7,859 2.00 


Top 段 是 根据 不 同 的 排序 方式 列 出 了 开销 最 大 的 几 个 对 象 《默认 情况 是 5 个， 可 以 通过 修改 
sprepins.sql 中 的 参数 来 修改 列 出 的 段 的 数量 )， 


























define top n events = 5; -- 顶 级 事件 的 显示 数量 ， 默 认 5 个 

define top n sql = 65; -- 顶 级 SQL 的 显示 数量 ， 默 认 65 个 

define top n segstat = 5; -- 顶 级 对 象 的 显示 数量 EAST 

define num rows per hash-5; -- 每 个 SQL 显示 的 最 多 行 数 ， 默 认 5 行 

Top 段 有 助 于 我 们 分 析 系 统 。 比 如 我 们 要 查找 缓冲 区 获取 较 多 的 段 ， 拿 本 例 来 看 吧 : 
TBCS INX PK PRIVILEGE ORG INDEX 396,406,768 28.48 
TBCS DATA PARAMETER, VALUE TABLE 260,254,096 18.70 





这 一 张 表 和 一 个 索引 占 了 整个 系统 缓冲 区 获取 的 47% 以 上 。 如 果 要 进行 优化 , 针对 这 两 个 对 象 进 
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行 优化 是 比较 有 效 的 。 如 果 我 们 要 查找 INI TRANS 参数 设置 不 合理 的 对 象 ， 可 以 从 ITL 等 待 最 
多 的 对 象 找 起 : 


Top 10 ITL Waits per Segment for DB: TBCS Instance: tbcsl Snaps: 37838 -37882 





-» End Segment ITL Waits Threshold: 100 

Subobject  Obj. ITL 
Owner Tablespace Object Name Name Type Waits Total 
TBCS DATA315 PK CYCLEINV BILLITEM CLEINVOICE INDEX 12 10.43 
TBCS DATA312 PK CYCLEINV BILLITEM CLEINVOICE INDEX 8 6.96 
TBCS DATA315 IDX STATO CHARGE FIN STATO CHAR INDEX 7 6.09 





这 几 个 索引 在 ITL 等 待 上 比较 多 ， 因 此 我 们 可 以 考虑 加 大 这 几 个 索引 的 INI TRANS 参数 。 


ENNIS) STATSPACK 报告 分 析 之 Top SQL 


查找 Top SQL( 顶 级 SQL) 的 工作 是 优化 工作 中 经 常 遇 到 的 .STATSPACK 报告 是 查找 Top SQL 
十 分 好 的 工具 。 根 据 不 同 的 目的 ,查找 Top SQL 有 不 同 的 过 滤 条 件 。 作 为 系统 整体 优化 来 说 , 我 
们 需要 找 出 对 系统 影响 最 大 的 SQL, 查找 的 过 滤 条 件 是 根据 总 的 缓冲 区 获取 或 者 读 来 排序 。 而 如 
果 我 们 的 目的 是 查找 性 能 存在 问题 的 SQL， 那 么 我 们 的 过 滤 条 件 可 能 是 单条 SQL 的 开销 ， 而 不 
是 在 某 个 时 间 段 内 的 总 开销 。 因 此 ， 两 种 方法 找 出 来 的 SQL 可 能 不 同 。 如 果 是 做 系统 优化 ， 老 
白 喜 欢 通过 STATSPACK 报告 来 查找 Top SQL, HF STATSPACK 报告 中 每 个 SQL 默认 显示 5 fr. 
而 对 于 绝 大 多 数 的 Top SQL 来 说 ， 大 多 数 超过 5 行 ， 所 以 在 生成 报告 前 ， 最 好 将 
num rows per hash 参数 加 大 为 10 或 者 更 大 。 下 面 是 一 个 例子 : 


SOL ordered by Gets for DB: BSS Instance: BSS Snaps: 4243 -4244 

-» End Buffer Gets Threshold: 10000 

-> Note that resources reported for PL/SQL includes the resources used by 
all SQL statements called within the PL/SQL code. As individual SQL 
statements are also reported, it is possible and valid for the summed 
total $ to exceed 100 








CPU Elapsd 
Buffer Gets Executions Gets per Exec  $Total Time (s) Time (s) Hash Value 
581,930 52 11,191.0 Vu 11.47 36.98 3229205788 


Module: JDBC Thin Client 
select * from (select star.*,rownum as numrow from ( select nvl( 


























a.return flag, ' ' ),nvl(a.service grade||' '||f.SERVICE GRADE. 
NAME, ' ' ), decode(nvl(a.cust grade,' '),'1','—fR#FI','2',! 
重要 客户 '，'3 '，' 至 关 重 要 客户 '，' 其 他 ') cust grade aa, nvl( a.shee 
tno," T ), nvl( a.serv no, ' ' ), nvl( a.new branch 
512,733 127 4,037.3 6.3 43.22 121.90 3717445708 
Module: JDBC Thin Client 
select order no ord no,nvl(num,'') num,decode(action type,1,'Cre 


ate',2,'Update',3,'Delete') action type,id flag,action type acti 
on type idx from tif bill order ctr where proc flag-'0' order 
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by TO NUMBER(trim(id flag)),TO NUMBER(trim(action type idx)) 


449,714 63 7,138.3 545 5.22 41.63 922404172 
Module: JDBC Thin Client 
select a.sell type,a.cons id ,b.CONS NAME from tcm user a ,TAM. 
CONSIGNEE b where a.user seq »0 and a.STATE - '1' and a.cons 
.id = b.CONS EXTER CODE and b.state -'1' and a.finish flag - 
'0O' and a.ord no -:1 union select a.sell type,a.cons id ,b.cm 
_id || b.name as CONS NAME from tcm user a ,TWM CUST MANAGER b w 


我 们 看 到 散 列 值 是 3229205788 的 SQL 的 缓冲 区 获取 占 整个 系统 的 7.1%， 对 这 个 SQL 进行 优化 
可 以 提升 系统 性 能 。 在 以 往 的 优化 项 目 中 , 我 们 经 常 能 够 看 到 占 系 统 总 体 缓 冲 区 获取 或 者 读 超过 
30% 的 SQL, 这 种 SQL 就 是 我 们 优化 的 重点 。 通 过 sprepsql.sql 脚本 ,可 以 查看 更 为 详细 的 信息 : 


STATSPACK SQL report for Hash Value: 3229205788 Module: JDBC Thin Client 


DB Name DB Id Instance Inst Num Release Cluster Host 

Bss 36751116 sg 19.2.0.6.0 NO LN-CRM-DB-A - 
Start Id Start Time End Id End Time Duration (mins) 
ace 4243 30-5 H -06 09:22:33 — 4244 30-5 月 -06 09:28:33 6.00 


SQL Statistics 


-> CPU and Elapsed Time are in seconds (s) for Statement Total and in 
milliseconds (ms) for Per Execute 








$ Snap 
Statement Total Per Execute Total 
Buffer Gets: 581,930 11,191.0 T0 
Disk Reads: 1,641 31.6 .12 
Rows processed: 363 740 
CPU Time(s/ms): 11 220.6 
Elapsed Time (s/ms): 37 FLA L 
Sorts: 52 L O 
Parse Calls: 52 1.0 
Invalidations: 0 
Version count: 1 
Sharable Mem(K): 135 
Executions: 52 
SOL Text 





SELECT * FROM (SELECT star.*,rownum as numrow FROM ( SELECT nvl( a.return flag, ' ' ), 









































nvl(a.service grade||' '||f.SERVICE GRADE NAME, ' ' ) 

decode(nvl(a.cust grade,' ')，'1'，' 一 般 客户 '，'2'，' 重 要 客户 '，'3 '，' 至 关 重 要 客户 ' ，' 其 他 ') 
cust grade aa, 

nvl( a.sheet no, ' ' ), nvl( a.serv no, ' ' ), nvl( a.new branch no, ' ' ), 
nvl( a.new num, ' ' ), nvl( a.install flag, '' ), nvl( a.old branch no, ' ' ), 
nvl( a.old num, ' ' ) 

nvl( a.sheet state, ' ' ), nvl( a.ord no, ' ' ) ord no, nvl( a.ask no, ' ' ) 
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nvl( a.spec flag, ' ' ), nvl(to char( a.besp date, 'yyyy-mm-dd hh24:mi:ss' ), ' 
227) 

nvl( a.sheet type, ' ' ), a.bureau no, nvl( a.notes, ' ' ), nvl( a.send site no, 
Je oui yos 

nvl(a.send staff no, ''), nvl(to char(a.send sheet date, 'yyyy-mm-dd hh24:mi:ss' ), 
ap > 

nvl( to char( a.crt sheet date, 'yyyy-mm-dd hh24:mi:ss' ), ' ' ), EL 

nvl( a.user seq, 0 ), nvl( a.prev bureau no, ' ' ), nvl( a.prev ord no, ' ' ) 
nvl( a.prev user seq, 0 ), nvl( e.user name, ' '), nvl( e.addr detail, ' ') 


addr detail 

from tom sheet manage a, tom exec order d,tcm user e,tvlcm service grade f where 
a.sheet type like :1||'%' and a.seq = 0 and a.sheet state = '1' and a.msg flag - 
"Qr 
and a.return flag «» '2' and a.return flag «» :2 and exists 

( SELECT /*+ hash sj */ 1 FROM tvlom site to info b WHERE a.dept code-b.dept code 
and b.site no -:3 
and b.site purview-'1' and b.bureau no-a.bureau no and b.seq- 0 ) 
and a.ord no - d.ord no AND d.USER ID - e.USER ID and d.user seq - e.user seq and 











a.service grade - f.service grade and 

f.STATE-'1' and d.seq = (select max(f.seq) from tom exec order f 
where d.ord no - f.ord no) order by ord no,addr detail desc) star ) 
where numrow<=(:4*:5) and numrow>((:6-1)*:7) 


Plans in shared pool between Begin and End Snap Ids 


Shows the Execution Plans found in the shared pool between the begin and end 
snapshots specified. The values for Rows, Bytes and Cost shown below are those 
which existed at the time the first-ever snapshot captured this plan - these 
values often change over time, and so may not be indicative of current values 
-» Rows indicates Cardinality, PHV is Plan Hash Value 

-> ordered by Plan Hash Value 


End of Report 

可 以 看 到 ， 在 这 个 报告 里 ， 这 个 SQL 的 完整 的 SQL Text 被 显示 了 出 来 ， 而 且 其 开销 也 清晰 
地 列 了 出 来 。 可 以 看 到 , 报告 最 后 的 执行 计划 部 分 是 空 的 ， 这 是 因为 该 报告 的 采样 级 别 是 默认 的 
5 级 。 如 果 你 的 Snap Level 是 6 或 者 更 高 的 ， 那么 执行 计划 也 会 详细 显示 。 在 做 SQL 优化 时 , 我 
们 经 常会 要 求 客 户 采 集 Snap Level 为 6 的 采样 点 ， 这 样 便于 我 们 进行 分 析 。 对 于 Oracle 10g 的 数 
据 库 ， 在 AWR 报告 中 ， 默 认 的 采样 就 包含 了 SQL 的 执行 计划 ， 这 对 于 我 们 分 析 SQL 是 很 有 帮 
助 的 。 比 如 下 面 的 案例 就 是 从 一 份 6 级 的 STATSPACK 报告 上 取 下 来 的 : 


STATSPACK SQL report for Hash Value: 1144597049 Module: JDBC Thin Client 











DB Name DB Id Instance Inst Num Release Cluster Host 


BSS 38876318 BSS 1.:9:2:2045:20. NO HB-CRM-DB-A 
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Start Id Start Time End Id End Time Duration (mins) 


15870 16-12 H-06 08:00:02 15871 16-12 H-06 09:00:04 


SQL Statistics 


-> CPU and Elapsed Time are in seconds (s) for Statement Total and in 


milliseconds (ms) for Per Execute 





$ Snap 
Statement Total Per Execute Total 
Buffer Gets: 25,722,170 388.4 20.31 
Disk Reads: T 0.0 .00 
Rows processed: 1,957 0.0 
CPU Time(s/ms): 276 4.2 
Elapsed Time(s/ms): 373 5.6 
Sorts: 671 .0 
Parse Calls: 66,253 1.0 
Invalidations: 0 
Version count: 4 
Sharable Mem(K): 39 
Executions: 66,221 
SQL Text 
SELECT BUREAU_NO, ORD_NO, ACTION_NO, DISPATCH_NO 
š nvl(SITE NO,' '), nvl(STAFF NO,' '), MSG N 
O FROM TOM_MSG A WHERE MSG_FLAG = '0' AND EXISTS (SE 
LECT 1 FROM TOM_EXEC_ORDER B WHERE A.ORD_NO = B.ORD_NO AND ASK 
_NO LIKE :1 ) order by msg_occur_date 


All Optimizer Plan(s) for this Hash Value 


Shows all known Optimizer Plans for this Hash value, and the Snap Id's they 


were first found in the shared pool 
-> ordered by Snap Id 


Plan 
Hash Value Snap Id Cost Optimizer 
3133398659 14880 17 CHOOSE 


1727509485 15811 567  CHOOSE 
3133398659 15863 48 CHOOSE 
3133398659 16009 80 CHOOSE 
3133398659 16013 253  CHOOSE 
3133398659 16114 23  CHOOSE 
2163395318 16145 126  CHOOSE 





Shows the Execution Plans found in the shared pool between the begin and end 


snapshots specified. The values for Rows, Bytes and Cost shown below are those 


which existed at the time the first-ever snapshot captured this plan - these 
values often change over time, and so may not be indicative of current values 
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-> Rows indicates Cardinality, 
-> ordered by Plan Hash Value 


PHV is Plan Hash Value 


SELECT STATEMENT 

SORT ORDER BY 

NESTED LOOPS SEMI 
TABI 


IN. 





LE ACCESS BY INDEX ROWID 
DEX RANGE SCAN 


LE ACCESS BY INDEX ROWID 





DEX RANGE SCAN 


TOM MSG 

IND MSG FLAG 

TOM EXEC ORDER 

FK TOM EXEC ORDER 
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PABA 漫长 的 一 夜 


飞机 到 深圳 时 已 经 是 晚上 6 点 多 了 ,我 拖 着 疲 备 的 身体 ， 正 准备 回 家 ， 突 然 一 个 电话 打 了 进 
来 ,是 我 们 公司 的 一 名 销售 人 员 。 他 问 我 能 不 能 马上 去 趟 广州 ， 有 个 客户 在 Sun 公司 做 一 个 应 用 
软件 测试 ， 在 测试 过 程 中 出 现 了 严重 的 性 能 问题 ,已 经 搞 了 4 天 了 ,还 是 没有 一 点 进展 ,明天 上 
班 前 如 果 不 能 搞定 ， 就 要 出 大 问题 了 。 

刚 经 过 了 4 个 多 小 时 的 旅程 ， 人 很 疲惫 ,而 且 快 一 个 星期 没 回 家 了 ,一 听 到 这 个 消息 ， 刚 开 
始 的 反应 是 能 不 能 推 掉 。 不 过 听 他 说 ,客户 那 边 确实 比较 紧急 , 而 且 客 户 是 国内 最 大 的 运营 商 之 
一 ， 也 是 一 个 拓展 客户 的 好 机 会 ， 所 以 最 后 我 还 是 答应 了 。 在 机 场 直接 叫 了 辆 出 租车 ， 对 司机 说 
去 广州 。 司 机 楞 了 一 下 说 ,“ 哥 们 ， 你 坚 了 吧 ， 去 广州 还 是 深圳 ?” 昕 我 确定 是 广州 ， 司 机 马上 
乐 开 了 花 ， 你 是 讲价 还 是 打 表 ， 如 果 打 表 可 能 要 400 元 。 我 说 打 表 吧 ， 反 正 有 人 报销 。 

在 出 租车 上 , 我 和 广州 的 联系 人 联络 了 一 下 ， 了 解 一 下 那 边 的 情况 , 以 便于 到 现场 时 可 以 更 
快 处 理 。 客 户 那 边 在 测试 一 个 应 用 ， 服 务 器 是 一 台 Sun FIRE 4900， 带 一 个 盘 阵 ，16 块 盘 ， 每 8 
块 组 成 一 个 RAID 0， 然 后 组 成 RAID 0+1， 只 划 了 一 个 LUN， 安 装 的 是 Solaris 10， 数 据 库 版 本 
是 Oracle 10.2.0.3。 在 测试 时 ， 他 们 发 现 某 个 应 用 模块 第 一 次 执行 48s， 第 二 次 执行 1 分 半 ， 每 次 
执行 都 会 比 前 一 次 慢 几 十 秒 ， 如 果 会 话 重新 连接 ， 又 会 恢复 为 8s， 然 后 逐渐 衰减 。 后 来 他 们 在 
一 台 安 装 了 Windows 虚拟 机 的 笔记 本 电脑 上 进行 测试 ， 发 现在 微机 上 运行 十 分 稳定 ， 都 是 平均 
25s 左右 。 这 里 就 有 两 个 问题 了 ， 一 是 为 什么 这 个 应 用 在 Sun FIRE 4900 小 型 机 上 跑 ， 比 性 能 
很 多 的 笔记 本 电脑 还 要 慢 那 么 多 ; 二 是 为 什么 这 个 应 用 会 越 执 行 越 慢 。 在 这 之 前 ,他 们 已 经 做 了 
4 天 的 优化 ， 大 量 的 DBA 和 Sun 的 技术 人 员 对 系统 做 了 各 种 优化 尝试 ， 均 以 失败 告终 。 从 现象 
上 看 ， 今 天 我 可 能 遇 到 了 一 个 十 分 棘手 的 问题 。 

晚上 7 点 多 , 我 到 达 了 位 于 大 都 会 广场 的 Sun 广州 办 事 处 , 测试 环境 就 搭建 在 那里 。 由 于 明 
天 下 午 下 班 前 , 这 个 测试 必须 完成 ,否则 本 次 测试 就 宣告 失败 了 。 解 决 问题 后 还 需要 在 测试 环境 
中 装载 大 量 的 测试 数据 ， 因 此 客户 给 我 进行 优化 的 最 后 期 限 是 明天 早上 8 : 00。 值 得 庆幸 的 是 ， 
开发 商 在 英国 那 边 研发 中 心 已 经 安装 了 相同 的 环境 , 并且 也 模拟 出 了 我 们 这 边 的 故障 情况 。 英 国 
研发 中 心 给 这 边 的 反馈 信息 是 , 他们 肯定 能 找到 问题 的 原因 , 但 是 需要 时 间 ， 最 多 再 给 他 们 两 天 
时 间 就 是 够 了 。 而 目前 对 于 这 个 项 目 来 说 ， 最 缺乏 的 也 是 时 间 。 

我 到 达 现 场 时 ,会 议 室 里 坐 得 满 满 的 ， 运 营 商 代表 、Sun 公司 的 技术 人 员 、 开 发 商 的 测试 小 
组 和 集成 商 的 技术 和 商务 人 员 都 在 等 着 最 后 的 结果 。 今天 晚上 是 最 后 期 限 ， 如 果 无 法 解决 这 个 问 
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题 ， 可 能 会 导致 项 目 失败 。 今 天 在 场 的 所 有 公司 都 可 能 面临 不 可 承受 的 失败 ， 所 以 会 议 室 里 的 气 
氛 很 紧张 。 运 营 商 的 项 目 经 理 姓 侯 ， 看 见 我 坐 下 ， 马 上 坐 到 我 的 身边 ， 他 说 :“ 我 们 为 这 件 事 已 
经 折腾 了 4 天 了 ， 你 是 我 们 最 后 一 棵 救命 稻草 ， 千 万 不 要 让 我 失望 啊 。 

在 车 上 我 就 一 直 在 想 如 何 处 理 这 个 问题 。 我 让 同事 帮 有 我 查 了 Oracle 的 bug 数据 库 , 希望 能 够 
找到 Oracle 10g 在 Sun 10 上 关于 性 能 的 bug。 在 我 走 进 大 都 会 广场 时 ， 深 圳 那 边 的 反馈 结果 是 没 
有 发 现 明 显 的 和 Solaris 10 相关 的 bug。 刚 才 在 路 上 ， 我 理 了 理 思 路 。 这 种 情况 ， 应 用 和 数据 库 、 
操作 系统 混合 在 一 起 ， 要 在 一 晚上 找到 并 解决 问题 也 确实 有 些 难 度 ， 因 此 在 晚上 的 分 析 过 程 中 ， 
不 能 走 太 多 弯路 ， 否 则 时 间 就 不 人 够 了 。 

通过 大 家 的 介绍 , 我 对 这 个 系统 的 第 一 印象 是 , 数据 库 性 能 可 能 存在 问题 , 这 个 性 能 问题 很 
可 能 和 Solaris 10 有 关 。 而 从 同事 给 我 的 信息 里 ， 在 Solaris 10 上 ，Oracle 10.2 没有 明显 的 和 性 能 
相关 的 bug。 因 此 ， 按 照 我 以 前 处 理 类 似 问题 的 惯例 ， 我 决定 还 是 从 应 用 入 手 分 析 问 题 。 

从 应 用 入 手 的 想法 一 到 客户 现场 就 被 打 乱 了 , 到达 现 场 后 , 我 首先 简单 了 解 了 问题 以 及 以 前 

他 们 做 的 一 些 工作 。 这 个 问题 是 几 天 前 发 现 的 , 开始 定位 为 Oracle 的 问题 , 这 段 时 间 里 已 经 有 好 
几 批 DBA 对 数据 库 进 行 了 各 种 各 样 的 优化 , 但 是 没有 任何 效果 。 他们 也 测试 了 写 一 个 小 的 程序 ， 
分 别 在 小 型 机 上 和 微机 上 跑 , 测试 结果 是 微机 快 于 小 型 机 。 具 体 之 前 做 了 哪些 优化 ， 由 于 前 面 的 
同行 没有 留 下 任何 文档 ， 无 从 考证 ， 所 以 我 只 能 从 头 开始 。 
在 会 议 桌 上 找 了 一 台 空 着 的 机 器 ， 我 首先 检查 了 AWR: 报告 ， 检 查 了 操作 系统 的 情况 在 这 
里 我 犯 了 一 个 明显 的 错误 ,由 于 网 管 对 外 来 电脑 设置 了 一 些 障碍 , 使 用 自己 的 电脑 需要 一 些 额 外 
配置 ， 我 没有 坚持 用 自己 的 电脑 ， 而 是 用 了 一 台 客 户 的 电脑 ， 这 个 下 忽 后 来 证 明 是 十 分 错误 的 ， 
我 也 因此 耽误 了 很 多 时 间 )， 发 现 操作 系统 的 物理 VO 很 高 ,并且 从 AWR 报告 上 发 现 重 做 日 志 相 
关 的 性 能 存在 问题 ， 但 是 物理 文件 的 VO 基本 正常 。 很 快 我 确定 了 第 一 步 的 调整 思路 ， 对 重 做 日 
志 相 关 的 配置 和 参数 进行 了 调整 ， 加 大 了 重 做 日 志文 件 的 大 小 ， 调整 了 Log Buffer 的 大 小 。 不 过 
调整 后 ， 数 据 库 的 性 能 没有 明显 的 改善 ， 应 用 的 问题 依旧 。 

这 个 时 候 , 现 场 开发 商 的 DBA 向 我 提供 了 一 系列 文档 ,大 多 数 都 是 Solaris 10 上 跑 Oracle 10g 
的 一 些 问 题 和 bug 的 资料 。 有 Sun 的 官方 文档 ， 也 有 网 上 搜 到 的 网 友 的 博客 和 帖子 。 我 简单 浏览 
了 一 下 , 初步 判断 这 些 资料 和 现场 的 问题 没有 直接 的 关联 。 虽 然 我 第 一 时 间 否 定 了 这 些 资料 , 但 
是 客户 的 思路 也 对 我 有 了 一 定 的 影响 ， 使 我 从 应 用 入 手 的 思路 有 了 一 定 的 改变 ， 更 加 侧重 于 
Oracle 10g 和 Solaris 配合 的 问题 。 使 我 改变 思路 的 主要 有 以 下 几 点 。 

(1) 就 是 这 个 系统 使 用 了 套装 软件 , 现场 人 员 连 应 用 访问 了 哪些 表 , 跑 了 哪些 SQL 都 不 清楚 。 
RM AWR 报告 中 看 到 的 Top SQL 的 情况 来 看 ，SQL 没有 明显 的 问题 。 如 果 我 还 是 从 应 用 入手 进 
行 分 析 的 话 ， 缺 乏 必 要 的 支持 。 

(2) 从 初步 的 分 析 来 看 , 数据 库存 在 性 能 问题 。 特别 是 log file parallel write 的 等 待 高 达 1 460 ms, 

(3) 操作 系统 的 VO 繁忙 程度 达到 95%, 

(4) 现场 人 员 经 过 4 天 的 分 析 ， 所 有 的 线索 都 指向 Solaris 10, 

(5) 应 用 通过 调用 PL/SQL 的 接口 访问 数据 库 ， 而 接口 全 部 是 WRAP 过 的 代码 ， 很 难 针对 代 
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码 进行 分 析 。 

这 个 时 候 , 已 经 是 晚上 9 点 多 了 ,目前 的 优化 重点 是 和 VO 相关 的 性 能 问题 。 匆忙 吃 过 快餐 ， 
对 目前 系统 的 情况 有 了 一 定 了 解 后 ,开始 进行 一 系列 测试 。 为 了 采集 更 多 的 信息 , 我 安装 了 一 个 
STATSPACK。 经 过 测试 发 现 , 重 做 日 志 切 换 的 时 间 十 分 长 ， 可 以 高 达 15s ( 重 做 日 志文 件 的 大 小 
为 2GB)。 从 STATSPACK 报告 上 看 , VO 还 是 存在 一 定 的 问题 。 日 志文 件 同 步 和 日 志文 件 并 行 写 
的 等 待 还 是 十 分 严重 。 在 此 阶段 ,设计 了 一 系列 测试 程序 测试 系统 的 性 能 。 通 过 测试 确认 了 系统 
的 IO 性 能 确实 存在 一 定 的 问题 ， 其 中 重 做 日 志 相 关 IO oy AEE. FRAN Sun 的 工程 师 讨 论 了 一 
下 ,他 的 结论 是 ， 存 储 的 条 带 化 处 理 比较 简单 ， 整 个 存储 对 于 频 紧 而 小 的 VO 处 理性 能 不 佳 。 他 
的 分 析 和 我 看 到 的 重 做 日 志 写 入 性 能 不 佳 是 吻合 的 ， 大 数据 量 的 写 入 ， 比 如 用 da 命令 来 测试 硬 
盘 读 写 速度 并 不 慢 。 

此 时 已 经 是 晚上 11 : 00 了 ， 而 现在 还 丝毫 看 不 到 找到 问题 的 希望 ， 现 场所 有 的 人 都 极为 紧 
张 ， 翡 观 的 情绪 也 弥漫 开 来 。 在 这 种 压力 下 ， 我 已 经 完全 偏离 了 预先 设 定 的 方向 ， 决 定 把 解决 
Oracle 和 操作 系统 的 配合 放 在 第 一 位 。 我 亲自 进行 了 测试 ， 发 现 插 入 数据 的 速度 并 不 慢 ， 而 提交 
所 消耗 的 时 间 很 长 ， 这 是 十 分 不 正常 的 。 通 过 10046 分 析 ， 看 出 主要 的 等 待 对 象 是 log file sync, 
由 于 Sun 的 负责 存储 的 工程 师 不 在 ， 所 以 无 法 得 到 更 进一步 的 关于 存储 配置 的 信息 。 

时 间 已 经 接近 12 : 00 了 ， 对 于 VO 的 分 析 也 取得 了 一 定 的 进展 。 在 启用 Direct IO ja, VO 
的 性 能 得 到 了 较 大 的 提升 ，log file sync 等 待 时 间 也 从 1000 多 毫秒 下 降 为 100 一 200 毫秒 。 虽 然 与 
正常 情况 相 比 ，log file sync 仍然 偏 高 , 但 是 已 经 没有 提交 需要 几 秒 钟 的 现象 了 。 从 简单 的 插入 测 
试 来 看 , 性 能 已 经 有 了 极 大 的 提升 。 我 要 求 客户 在 小 型 机 和 微机 上 分 别 测试 一 个 大 批量 插入 数据 
的 小 程序 ， 发 现 小 型 机 的 性 能 已 经 明显 高 于 微机 的 性 能 。 这 个 测试 结果 一 出 来 ,所 有 的 人 都 为 之 
一 振 。 但 是 接 下 来 的 测试 结果 令 人 诅 形 ， 应 用 的 测试 结果 依旧 ， 性 能 没有 任何 提升 ， 仍 然 是 48 
秒 ， 一 分 半 ，.…… 

在 这 种 情况 下 ， 几 乎 所 有 人 都 感到 失去 了 信心 。 一 直 坐 在 我 身边 的 侯 经 理 拿 出 手机 ， 开 始 联系 
其 他 的 外 援 。 我 能 够 很 清楚 地 听 到 他 在 和 一 个 号 称 能 够 协助 解决 这 个 问题 的 Sun 方面 的 高 手 在 谈 价 
钱 ， 那 个 人 开价 是 解决 问题 4 万 块 钱 ， 没 解决 收 4 000 块 车 马 费 。 客 户 和 开发 商 协商 了 一 下 ， 大 家 
都 觉得 开价 太 高 ， 而 且 那 个 人 并 不 承诺 一 定 解决 问题 。 听 了 那个 哥们 的 滥 天 要 价 ， 我 突然 觉得 自己 
的 要 价 是 不 是 太 低 了 ， 刚 才 Andy 和 我 说 是 只 有 一 晚上 的 时 间 ， 如 果 搞 定 ， 客 户 愿意 出 6000 块 钱 。 

这 个 时 候 已 经 快 1:00 了 ， 侯 经 理 拍 拍 我 的 肩膀 说 :“ 老 兄 ， 你 再 继续 努力 ， 大 家 都 指望 你 
了 ， 我 明天 上 午 有 个 会 ， 所 以 必须 回去 睡 一 觉 了 。 你 如 果 有 好 消息 ， 一 定 给 我 发 个 短信 。 

虽然 问题 还 是 没有 解决 , 不 过 看 着 这 个 测试 结果 ,我 却 有 种 突然 惊醒 的 感觉 。 从 目前 的 测试 
情况 来 看 , 数据库 的 整体 性 能 至 少 提升 了 30% 以 上 ,而 应 用 没有 任何 提升 。 好 像 应 用 的 性 能 和 数 
据 库 的 性 能 无 关 似 的 。 这 个 现象 说 明 我 们 以 前 的 主攻 方向 可 能 是 完全 错误 的 ， 影 响应 用 性 能 的 关 
键 不 在 数据 库 方面 ， 也 不 在 操作 系统 方面 ， 而 是 在 应 用 本 身 。 此 时 英国 方面 已 经 准备 下 班 了 ， 开 
发 商 的 代表 问 我 有 没有 可 能 在 一 个 小 时 内 搞定 , 否则 英国 那 边 配 合 我 们 会 有 问题 。 我 说 无 论 如 何 
英国 那 边 一 定 要 有 一 个 人 配合 我 们 , 希望 他 们 最 好 能 够 加 班 ， 因 为 我 有 个 感觉 问题 应 该 是 出 在 
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应 用 上 ,而 且 我 有 信心 在 今天 晚上 找到 它 。 经 过 多 方面 的 协商 ， 英 国 研发 中 心 那 边 有 个 哥们 终于 
答应 回 家 后 通过 VPN 继续 为 我 们 提供 支持 。 

这 时 我 才 想起 来 使 用 我 的 电脑 ， 这 样 我 可 以 利用 自己 的 一 些 工具 对 系统 进行 分 析 。 还 好 Sun 
的 工程 师 还 在 现场 , 我 马上 让 他 帮 我 设 好 了 上 网 的 一 切 权限 。 我 决定 使 用 profiler 工具 对 PL/SQL 
代码 进行 跟踪 。 虽 然 代码 是 WRAP 过 的 ， 但 是 我 们 起 码 能 够 看 到 函数 名 以 及 代码 的 行 号 。 我 需 
要 开发 商 协助 我 写 一 个 小 的 测试 程序 ， 模 拟 创 建 广 点 的 操作 。 然 后 用 profiler 对 这 个 测试 程序 进 
行 跟踪 。 在 测试 进行 之 前 ， 我 首先 在 济 试 环境 中 安装 好 profiler 工具 。 实 际 上 ，profiler 工具 所 需 
的 安装 脚本 本 身 在 rdbms/admin 目录 下 就 有 ， 只 需要 在 sys 账号 下 执行 一 下 profload.sql， 然 后 在 
要 测试 的 账号 下 面 跑 一 下 proftab.sql 就 可 以 了 。 

在 开发 商 的 协助 下 ,我 们 很 快 用 PL/SQL 写 出 了 一 个 模拟 调用 API 的 小 程序 ， 这 个 小 程序 将 
作为 我 们 测试 的 依据 。 首 先 ， 我 编写 了 一 个 PL/SQL 小 程序 ， 调 用 这 个 接口 : 


declare 
err number; 
errcode number; 
iotest varchar2(100); 
begin 
for i in 1..20 loop 
pkgsession.configuresession(); 
test (iv_name=>'m3m' | |to_char(i),in_execount=>1000, on_errorcode=>err, ov_errortext=> 
iotest); 
insert into templ values (systimestamp); 
commit; 
end loop; 
end; 
人 


通过 这 个 小 程序 ,我 们 发 现 , 第 一 个 循环 6s 就 结束 了 ， 第 二 次 循环 消耗 10s, 今后 每 次 循环 
都 以 四 五 秒 钟 的 时 间 递 增 。 而 如 果 我 们 重新 开 一 个 会 话 , 第 一 次 循环 又 变 为 6s。 如 此 规律 在 每 次 
测试 中 都 重 现 ， 看 样子 我 快要 抓 住 问 题 的 关键 了 。 此 时 已 经 是 凌晨 1 : 00， 英 国 那 边 也 传 来 一 个 
临时 措施 ,就 是 每 次 调用 该 接口 后 都 重新 连接 一 下 数据 库 。 从 目前 的 情况 来 看 ,这 个 可 以 作为 备 
选 方案 , 但 是 这 并 不 是 解决 问题 的 正确 途径 ， 因 为 连接 数据 库 也 是 一 个 开销 十 分 大 的 操作 ,肯定 
会 影响 最 终 的 测试 结果 。 

从 上 述 测试 更 加 确定 了 应 用 存在 问题 , 下 一 步 就 是 如 何 找到 到 底 问 题 出 在 哪里 。 这 时 profiler 
就 可 以 派 上 用 场 了 。 通 过 profiler 编写 如 下 脚本 : 


declare 
err number; 
errcode number; 
iotest varchar2 (100); 
begin 
for i in 1..3 loop 
err:-DBMS PROFILER.START PROFILER ('test' | | to cbar(i));: 
pkgsession.configuresession(); 
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test(iv name-»'Aba'||to char(i),in execount-21000,0n errorcode-»err,ov errortext-» 
iotest); 

err:-DBMS PROFILER.STOP PROFILER ; 

insert into templ values (systimestamp); 

commit; 

end loop; 
end; 
/ 


从 profiler 的 测试 结果 ， 我 们 发 现 第 一 个 循环 和 第 二 个 循环 调用 的 顺序 (无 法 看 到 源码 ， 只 
能 看 到 包 的 名 称 、 存 储 过 程 的 名 称 以 及 每 行 代码 的 行 号 ， 通 过 行 号 分 析 ) 是 不 同 的 ， 因 为 程序 执 
行 的 行 数 和 行 号 完全 不 同 , 而 从 第 二 次 开始 每 次 调用 执行 的 程序 从 行 号 上 看 , 所 有 调用 顺序 是 完 
全 相同 的 。 

我 们 将 第 二 次 和 第 三 次 执行 的 所 有 行 的 统计 信息 复制 到 一 个 Excel 表 中 ， 然 后 按照 每 行 的 执 
行 时 间 排 序 。 经 过 排序 后 ,我 们 发 现 , 第 二 次 和 第 三 次 执行 的 统计 信息 按照 执行 时 间 排 序 后 ， 排 
在 前 三 位 的 行 的 行 号 是 完全 相同 的 ， 不 过 这 三 行 中 第 三 次 执行 的 次 数 比 第 二 次 执行 次 数 多 了 100 
万 次 ， 这 100 万 次 消耗 的 时 间 正 好 是 Ss， 正 是 第 三 次 执行 比 第 二 次 执行 慢 的 时 间 。 

这 可 能 是 问题 所 在 了 。 分 析 结 果 一 出 来 , 实验 室 中 所 有 的 人 都 兴奋 起 来 。 在 通知 英国 方面 的 
同时 ,我 们 马上 在 笔记 本 电脑 上 进行 了 相同 的 测试 。 测 试 结果 发 现 ， 在 笔记 本 电脑 上 ,根本 找 不 
到 调用 这 个 包 的 代码 。 笔记本 电脑 上 根本 就 没有 这 些 操 作 , 这 就 是 说 笔记 本 电脑 和 小 型 机 上 跑 的 
应 用 是 有 区 别 的 。 经 过 确认 ， 两 个 环境 上 安装 的 是 完全 相同 的 软件 。 以 我 多 年 软件 开发 的 经 验 ， 
虽然 两 个 环境 安装 的 是 相同 的 软件 , 但 是 可 能 存在 某 种 开关 , 在 笔记 本 电脑 上 关闭 了 引起 小 型 机 
上 性 能 下 降 的 调用 操作 。 看 样子 这 回 找到 了 问题 的 根源 ,这 时 已 经 是 凌晨 3 点 多 了 。 我 让 和 英国 
沟通 的 哥们 通过 MSN 告诉 英国 方面 ， 他 们 的 重点 应 该 放 在 开关 上 ， 因 为 配置 文件 已 经 确认 过 很 
多 次 了 ,肯定 不 会 是 配置 文件 存在 不 一 致 ， 肯定 是 软件 内 部 的 一 个 开关 引起 的 。 这 个 开关 可 能 在 
某 些 平 台 上 的 默认 值 不 同 。 

半 个 小 时 后 ， 英 国 方面 的 研究 结果 反馈 回来 了 : 这 三 行 代码 是 测试 使 用 的 , 本身 在 生产 环境 
中 就 不 应 该 执行 。 他 们 建议 我 们 在 安装 这 个 软件 的 Oracle 用 户 上 关闭 一 个 策略 。 我 们 按照 英国 方 
面 的 指引 ， 关 闭 了 那个 策略 ， 然 后 马上 启动 了 那个 测试 程序 。 大 家 都 盯 着 那个 测试 工程 师 的 脸 ， 
希望 从 他 的 脸 上 看 到 笑容 。 突 然 那个 哥们 举 起 拳头 大 叫 了 一 声 “ 搞 定 ”， 房 间 里 爆发 出 热烈 的 掌 
声 ， 大 家 都 激动 地 涌 到 测试 终端 的 面前 。 

现场 工程 师 马上 通过 MSN 把 这 边 的 测试 结果 告诉 了 英国 那 思 ， 英 国 那 边 也 是 兴奋 异常 。 由 
于 这 次 测试 的 结果 可 能 决定 了 这 个 产品 在 中 国 的 生存 问题 , 所 以 英国 研发 中 心 虽然 下 了 班 , 还 是 
有 儿 个 人 放弃 了 休息 , 自发 留 在 办 公 室 里 协助 我 们 , 他 们 得 知 问题 得 到 解决 的 消息 , 也 十 分 兴 
决定 等 会 就 一 起 去 酒吧 蝎 儿 杯 。 问 题 终 于 得 以 解决 。 虽 然 大 家 忙 了 一 晚上 ,但 是 问题 得 到 了 圆满 
的 解决 ， 大 家 的 心情 还 是 比较 愉快 的 。 

现在 已 经 是 凌晨 4 : 00 了 。 从 刚才 测试 的 结果 来 看 , 平均 创建 一 个 市 点 的 时 间 是 Ss, 为 了 完 
成 这 次 测试 ， 需 要 预先 装载 20 万 个 这 样 的 节点 。 以 目前 的 速度 来 看 ， 还 需要 儿 百 个 小 时 才能 够 
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完成 数据 的 装载 操作 。 气氛 一 下 子 又 跌倒 了 谷底 。 RETE, 我 建议 他 们 不 要 使 用 程序 装载 数据 ， 
而 是 直接 写 一 个 PL/SQL 存储 过 程 ， 批 量 载 和 人 数据， 加 上 bulk 操作 ， 估 计 可 以 在 3 一 5 个 小 时 完 
成 数据 装载 。 听 到 这 个 消息 ,大 家 又 兴奋 起 来 了 ， 不 过 问题 又 来 了 ,英国 那 边 的 人 已 经 一 个 也 联 
系 不 上 了 ， 而 广州 这 边 没 有 一 个 人 知道 装载 市 点 需要 对 哪些 表 做 些 什么 操作 。 

我 说 这 个 倒 不 怕 ， 通 过 设置 一 个 10046 Trace， 就 可 以 找 出 生成 一 个 节点 需要 执行 哪些 DML 
操作 了 。 通过 10046, 我 们 很 快 把 所 有 的 DML 操作 都 找 了 出 来 , 而且 他 们 的 开发 人 员 对 PL/SQL 
中 使 用 bulk 操作 很 熟悉 ， 那 后 面 就 很 好 办 了 。 我 和 他 们 交代 了 一 下 ， 就 离开 了 。 上 昨天 订 了 一 个 
酒店 , 也 基本 没 用 上 。 我 开房 间 时 , 服务 员 告诉 我 , 现在 广州 开交 易 会 , 你 预定 的 是 昨天 的 房间 ， 
所 以 虽然 你 6 点 以 后 才 入 住 的 , 但 是 我 们 还 是 要 按照 昨 晚 入 住 算 房 费 。 我 说 这 都 无 所 谓 了 ,反正 
有 人 买单 ， 你 给 我 找 个 安静 点 的 地 方 就 行 了 。 

一 看 到 舒服 的 床 ， 就 什么 都 不 想 了 ， 我 一 沾 枕 头 就 睡 着 了 ， 一 觉 睡 到 中 午 12 : 30。 做 了 这 
么 一 个 激动 人 心 的 项 目 , 居然 能 够 沾 枕 头 就 睡 , 看 样子 服务 做 长 了 , 对 优化 已 经 没有 什么 新 鲜 感 了 。 


E 2 优化 由 技巧 ) 本 案例 的 启示 


这 是 一 个 十 分 典型 的 性 能 优化 案例 ,也 是 一 个 给 人 很 多 启发 的 案例 ,从 中 我 总 结 了 以 下 几 点 。 

(1) 处 理 类 似 的 案例 ,一 定 要 有 很 好 的 预案 ,不 能 因为 一 些 未 预料 到 的 细节 而 轻易 改变 方案 。 
在 这 个 过 程 中 ， 最 初 我 设 定 的 预案 没有 问题 ， 以 应 用 为 核心 进行 分 析 。 我 也 一 度 偏离 了 正确 的 方 
向 。 如 果 一 直 坚 持 以 应 用 为 核心 的 分 析 原 则 ， 可 能 可 以 提前 几 个 小 时 解决 这 个 问题 。 

(2) 作为 DBA， 应 该 了 解 小 型 机 、 硬 件 、 操 作 系统 、 数 据 库 、 应 用 开发 。 对 于 这 种 问题 ， 一 
个 不 了 解 应 用 开发 的 DBA 是 很 难 找到 根源 的 。 

(3) 要 敢于 坚持 自己 的 正确 观点 ， 要 有 足够 的 能 力 判断 自己 是 在 做 正确 的 事情 ， 不 要 轻易 被 
其 他 声音 淹没 。 其 他 技术 人 员 的 观点 可 以 参考 和 借鉴 , 但 是 应 该 能 够 对 这 些 信息 进行 分 析 ， 而 不 
能 不 加 思考 地 全 盘 接收 。 

(4) 在 这 个 处 理 过 程 中 ， 客 户 也 给 我 提醒 过 ， 做 调 优 ， 能 提升 20% 就 不 错 了 ， 而 现在 的 问题 
已 经 不 是 20% 那 么 简单 。 而 我 开始 时 过 多 地 把 时 间 放 在 了 调 优 上 面 ， 后 来 发 现 log file sync 虽然 
很 严重 ， 但 是 也 仅仅 占 到 10% 左 右 。 而 解决 这 个 问题 花 掉 了 超过 60% 的 时 间 。 

(5) 要 活用 Oracle 的 工具 。profiler 一 般 是 用 来 调试 PL/SQL 程序 的 ， 但 是 这 时 ， 变 成 了 问题 
查找 的 利器 。 

(6) 事后 大 家 在 讨论 ,为 什么 这 个 应 用 的 问题 , 英国 那 边 有 相同 的 环境 , 能 够 重演 相同 的 问题 ， 
又 有 那么 多 开发 人 员 介 入 ,没有 找到 问题 的 根源 ， 而 我 们 能 够 在 这 么 快 的 时 间 就 解决 了 问题 ? 最 
后 的 结论 是 ， 英 国 那 边 缺乏 有 经 验 的 DBA。 很 多 事情 ，DBA 和 开发 人 员 一 起 才 是 最 好 的 组 合 ， 
仅仅 有 一 样 是 不 够 的 。 这 个 案例 是 最 好 的 证 明 。 


注 本 节 案 例 使 用 的 一 个 Oracle 工具 profiler, ZA 5 A 20 日 的 “优化 小 技巧 ”中 有 详细 介绍 ， 
请 参考 。 















































后 记 ， 也 算 结 束 语 





到 今天 , 这 本 书 也 就 结束 了 ,其 中 介绍 了 一 个 实际 的 优化 案例 。 有 些 读者 可 能 会 感到 里 面 的 
内 容 有 些 乱 ， 也 有 些 人 可 能 感觉 抓 不 到 头脑 ， 不 知道 我 想 表 达 些 什么 。 确 实 ， 这 本 书 如 果 当 做 小 
说 来 看 ， 未 免 大 枯燥 ;如 果 当 做 纪实 文学 来 看 ， 又 不 能 弘扬 主旋律 ， 作 为 技术 书 来 看 ， 里 面 又 缺 
乏 有 分 量 的 技术 。 实 际 上 , 我 在 刚 开 始 就 说 过 ， 本 书 不 是 一 本 介绍 Oracle 技术 的 书 ， 因 此 读者 并 
不 需要 像 读 技 术 书 那样 一 字 一 句 地 去 抠 一 些 字眼 ,通过 这 本 书 , 老 白 给 大 家 展现 了 一 个 优化 项 目 ， 
并 且 教 给 大 家 一 些 系统 优化 的 方法 和 技巧 , 特别 是 在 优化 项 目 中 如 何 控 制 项 目 , 如 何 让 整个 优化 
工作 按照 自己 的 预想 进行 。 

粗 粗 看 一 遍 本 书 ,可 能 会 感觉 一 个 优化 项 目 里 好 像 也 没有 什么 , 实际 上 如 果 你 能 够 仔细 回味 
一 下 ,或 者 把 本 书 仔细 翻阅 两 遍 ， 你 会 发 现在 平淡 的 工作 中 还 隐藏 了 很 多 内 容 。 实 际 上 ， 优 化 项 
目 里 面 并 没有 十 分 高 深 的 技术 手段 。 本 书 中 , 老 白 和 老 于 他 们 采取 的 所 有 技术 手段 都 是 大 家 以 往 
学 习 过 的 ， 都 是 一 些 耳熟能详 的 东西 。 没 有 做 过 优化 项 目的 人 ， 可 能 觉得 做 一 个 优化 项 目 无 从 入 
手 。 也 有 一 些 人 可 能 感觉 优化 项 目 里 使 用 的 技术 不 过 如 此 ， 优 化 实际 上 也 不 是 什么 很 难 的 事情 ， 
不 过 如 果 你 真 的 去 做 一 个 优化 项 目 ， 就 会 感觉 好 多 地 方 都 无 法 把 握 。 确 实 是 这 样 ， 优 化 项 目 中 最 
难 的 是 准确 的 判断 ， 准 确 的 把 握 。 在 前 期 的 数据 采集 和 分 析 阶 段 ， 你 真 的 已 经 了 解 了 系统 的 现状 
和 主要 问题 吗 ? 实际 上 ， 要 回答 这 个 问题 并 不 简单 ， 这 需要 很 丰富 的 经 验 。 如 果 你 对 数据 库 的 原 
理 融 会 贯通 了 , 那么 很 容易 从 数据 库 运 行 的 原理 去 考虑 问题 , 也 就 很 容易 找到 目前 系统 存在 什么 
问题 。 否 则 ， 你 可 能 无 法 抓 住 主要 问题 ， 真 要 是 这 样 ， 这 次 优化 基本 上 就 报销 了 。 

其 实 本 书 各 部 分 的 内 容 都 是 我 精心 安排 的 , 哪怕 是 一 些 好 像 没 有 什么 技术 内 容 的 章 证 。 比 如 
“电脑 坏 了 ” 那 一 市 讲 的 虽然 是 我 的 电脑 坏 掉 了 ， 如 何 去 修理 ， 如 何 通 过 小 齐 从 HP 沈阳 办 事 处 
借 了 一 台电 脑 。 实 际 上 ， 这 一 市 的 安装 软件 那 方 面 的 内 容 ， 介 绍 了 一 个 DBA 的 电脑 里 最 常用 的 
工具 软件 。 我 虽然 不 是 一 个 唯 工具 论 者 , 但 是 我 认为 工 欲 善 其 事 , 必 先 利 其 器 。 适 当地 使 用 工具 ， 
合理 地 使 用 工具 是 十 分 重要 的 ,一 个 只 会 使 用 SQL*Plus 的 DBA 并 不 一 定 就 是 一 名 优秀 的 DBA, 

“世博 园 一 日 游 ” 那 一 市 实际 上 是 要 向 读者 说 明 DBA 和 客户 沟通 时 应 该 掌握 一 定 的 技巧 , 做 
DBA 不 能 光 有 技术 ， 而 且 需 要 通过 一 些小 手段 ， 让 客户 对 你 产生 信任 ， 以 及 出 现 危 机 时 ， 如 何 
去 化 解 和 扭转 。 

对 于 每 个 DBA 或 者 想 成 为 DBA 的 读者 来 说 , DBA 日 记 从 另外 一 个 侧面 介绍 了 一 名 DBA 应 
该 如 何 去 工 作 ， 在 DBA 工作 和 生活 中 有 哪些 需要 注意 的 地 方 。 这 也 是 我 写作 本 书 的 初 囊 ， 因 为 
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我 觉得 目前 市 场 上 缺乏 这 样 一 本 书 。 我 希望 大 家 可 以 愉快 地 阅读 本 书 , 也 希望 读者 能 在 轻松 的 阅 
读 中 获得 一 些 知识 ， 掌 握 一 些 技巧 ， 仅 此 而 已 。 我 更 希望 有 更 多 的 DBA 把 自己 真实 的 经 历 和 感 
受 写 出 来 ， 展 现 给 大 家 ， 希望 DBA 的 圈子 能 够 更 加 开放 。 








Oracle 优 化 日 记 


一 个 金牌 DBA 的 故事 


“我 知道 很 多 DBA 都 有 自己 收藏 的 一 本 秘籍 ， 包 括 处 理 各 种 Oracle 问 题 的 必 杀 术 ， 其 中 关于 性 能 调 优 的 特别 多 。 可 惜 这 

里 面 有 很 多 道听途说 的 成 分 ， 或 者 知 其 然而 不 知 其 所 以 然 。 反 观 此 书 ， 有 很 多 活 学 活用 的 例子 ; 对 于 各 种 技巧 的 适用 范围 ， 
也 尽量 阐述 清楚 。 从 最 后 成 书 的 内 容 看 ， 作 者 还 是 比较 负责 的 。 书 中 的 指令 ， 大 都 经 过 上 机 验证 。” 

一 一 Ben Wang， 澳 大 利 亚 知 名 Oracle 技 术 高 手 


数据 库 优化 一 直 是 DBA 感 到 十 分 高 深 的 问题 ， 很 多 DBA 学 习 了 大 量 优化 技术 ， 参 加 了 大 量 培训 ， 但 是 仍然 感觉 在 实际 工 
作 中 无 从 入 手 。 实 际 上 ， 在 数据 库 优化 工作 中 ， 比 技术 更 为 重要 的 是 方法 。 

本 书 以 作者 亲身 经 历 的 一 个 大 型 优化 项 目 为 原型 ， 用 日 记 的 形式 讲述 了 项 目 实施 的 全 过 程 。 生 动 曲折 的 项 目 故事 ， 扣 人 
心弦 的 尖峰 1 时刻， 一 一 再 现 了 几 个 经 验 丰 富 的 老 DBA 分 析 数 据 库 性 能 问题 时 的 真实 场景 。 书 中 不 仅 剖析 了 优化 过 程 ， 还 展现 
了 在 优化 项 目 中 处 理 纷繁 的 关系 的 技巧 和 方法 。 伴 随 精 彩 的 故事 情节 ， 作 者 还 介绍 了 DBA 常 用 的 优化 技巧 ， 使 读者 在 大 呼 过 
疗 的 同时 ， 亦 能 分 享 到 金牌 DBA 的 宝贵 经 验 。 
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